面向人脸检测MTCNN网络的加速硬件设计

Computer Engineering and Design(2022)

引用 0|浏览6
暂无评分
摘要
为加快深度学习人脸检测算法MTCNN(multi-task convolution neural network)的推理速度,满足许多应用场合检测的实时性的要求,基于Xilinx FPGA ZCU102开发板设计针对MTCNN专门优化的卷积和全连接加速硬件.该加速硬件不仅适用于MTCNN网络,其它神经网络推理算法也可以使用.针对算法特点,硬件采用小而多的计算核心,支持动态分块、图像间混合计算、片上多核共享RAM等完全自主开发的软硬件协同技术.在100 MHZ的频率下对MTCNN应用在加速器上的加速效果进行测试并和ARM程序进行对比,可以得到加速器相对于ARM O2速度加快了6倍多.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要