GFD-Retina - Gated Fusion Double RetinaNet for Multimodal 2D Road Object Detection.

Robin Condat,Alexandrina Rogozan,Abdelaziz Bensrhair

ITSC（2020）

引用 4|浏览21

暂无评分

摘要

In the field of Advanced Driver-Assistance Systems, road traffic actors detection is a vital task in order to avoid human errors in driving. Unlike camera only-based convolutional neural networks for 2D object detection, multimodality using improve object detectors accuracy and robustness. In this paper, we propose Stacked Fusion Double RetinaNet (SFD-Retina) and Gated Fusion Double RetinaNet (GFD-Retina), two convolutional neural networks taking multimodal data (RGB, Depth from Stereo, Optical Flow, LIDAR Point Cloud) as input. These networks combine efficiently sensor specific properties by using both early fusion and middle fusion for detecting road objects and their 2D localization. Evaluation of SFD-Retina and GFD-Retina on the challenging KITTI object detection benchmark shows that using sensor fusion improve significantly object detection accuracy. Moreover, GFD-Retina with Gated Fusion Unit outperforms SFD-Retina with Stacked Fusion Unit, and obtain satisfying results against state-of-the-art algorithms.

查看译文

关键词

GFD-Retina,multimodal 2D road object detection,advanced driver-assistance systems,camera only-based convolutional neural networks,SFD-Retina,multimodal data,early fusion,middle fusion,sensor fusion,gated fusion unit,gated fusion double RetinaNet,road traffic actor detection,stacked fusion unit,KITTI object detection benchmark,human errors,stacked fusion double RetinaNet,RGB,optical flow,LIDAR Point Cloud,2D localization

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要