基于 GPU 的卷积检测模型加速

wf(2016)

引用 0|浏览1
暂无评分
摘要
近年来,形变部件模型和卷积神经网络等卷积检测模型在计算机视觉领域取得了极大的成功。这类模型能够进行大规模的机器学习训练,实现较高的鲁棒性和识别性能。然而训练和评估过程中卷积运算巨大的计算开销,也限制了其在诸多实际场景中进一步的应用。利用数学理论和并行技术对卷积检测模型进行算法和硬件的双重加速。在算法层面,通过将空间域中的卷积运算转换为频率域中的点乘运算来降低计算复杂度;而在硬件层面,利用 GPU 并行技术可以进一步减少计算时间。在 PASCAL VOC数据集上的实验结果表明,相对于多核 CPU,该算法能够实现在单个商用 GPU 上加速卷积过程2.13~4.31倍。
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要