GPU高性能编程CUDA实战—book.h CPUBitmap.h等头文件
2021-06-14 14:22:51 54KB book.h CPUBitmap.h
1
PyTorch中的非负矩阵组合 PyTorch不仅是一个很好的深度学习框架,而且还是矩阵操作和大数据卷积方面的快速工具。 一个很好的例子是 。 在此程序包中,我基于torch.nn.Module在PyTorch中实现了NMF,PLC​​A及其反卷积变化,因此可以在CPU / GPU设备之间自由移动模型并利用cuda的并行计算。 模组 NMF 基本的NMF和NMFD模块使用乘法更新规则将beta差异最小化。 乘数是通过torch.autograd获得的,因此减少了代码量并且易于维护。 该界面类似于sklearn.decomposition.NMF ,但具有一些其他选项。 NMF :原始NMF算法。 NMFD :一维反卷积NMF算法。 NMF2D :二维反卷积NMF算法。 NMF3D :3-D反卷积NMF算法。 可编程逻辑控制器 基本的PLCA和SIPLCA模块使用EM算法来最
2021-06-11 20:31:24 1.8MB gpu pytorch nmf em-algorithm
1
《GPU高性能编程CUDA实战》源码
2021-06-10 23:25:40 299KB GPU编程CUDA
1
CUDA并行程序设计GPU编程指南(包含原书代码book.h CPUBitmap.h等)
2021-06-10 23:19:34 74.35MB gpu 多线程
1
英伟达官方2021.6最新CUDA程序 cuda_11.3.1_465.89_win10百度网盘链接 适用于win10 64,亲测可用
2021-06-09 16:09:38 78B 英伟达 NVIDIA CUDA GPU
高清cuda学习文档 CUDA并行程序设计 GPU编程指南和CUDA_C_Programming_Guide
2021-06-09 16:06:06 133.04MB CUDA 并行程序设计 GPU编程
1
tensorflow2.6whl,适配cuda11。适用的cudnn版本为8.1.0,cuda版本为11.0.2。
2021-06-09 09:10:16 320.84MB tensorflow cuda cudnn
1
GPU-Z GPU检测.exe
2021-06-08 14:03:19 6.73MB GPU-Z
1
mobilenetv3 这是MobileNetV3架构的多GPU Tensorflow实现,如论文。 对于一些更改。 论文V1的实现请参见该存储库中的以获得详细信息。 在tf1.3.0,tf1.10.0,python3.5上进行了测试。 mobilenetv3大 mobilenetv3小 用法 from mobilenet_v3 import mobilenet_v3_large, mobilenetv3_small model, end_points = mobilenet_v3_large(input, num_classes, multiplier=1.0, is_training=True, reuse=None) model, end_points = mobilenet_v3_small(input, num_classes, multiplier=1.0, is_trai
2021-06-07 23:36:51 8KB Python
1
消息! 2020年8月: 发布了! 更强大的追踪! 包括全身(脸,手,脚)要点! 现在可用。 2019年12月:AlphaPose 发布了! 较小的型号,更高的精度! 2019年4月:发布的AlphaPose! 在COCO验证集上,它以23 fps的速度运行。 2019年2月: 集成到现在AlphaPose! 2018年12月:了PoseFlow的! 3倍更快,支持姿态跟踪结果可视化! 2018年9月: 发布了! 它在COCO验证集上以20 fps的速度运行(平均每张图像4.6人),并达到71 mAP! AlphaPose 是一种精确的多人姿势估计器,它是第一个开源系统,在COCO数据集上达到70+ mAP(75 mAP),在MPII数据集上达到80+ mAP(82.1 mAP)。 为了在帧中匹配与同一个人相对应的姿势,我们还提供了一种称为Pose Flow的高效在线姿势跟踪
2021-06-07 14:56:14 40.06MB tracking skeleton gpu realtime
1