融合注意力的拉普拉斯金字塔单目深度估计

Journal of Graphics(2023)

引用 0|浏览0
暂无评分
摘要
随着深度神经网络的迅速发展,基于深度学习的单目深度估计研究集中于通过编码器-解码器结构回归深度,并取得了重大成果.针对在大多数传统方法中,解码过程通常重复简单的上采样操作,存在无法充分利用编码器的特性进行单目深度估计的问题,提出一种结合注意力机制的致密特征解码结构,以单张RGB图像作为输入,将编码器各层级的特征图融合到拉普拉斯金字塔分支中,加强特征融合的深度和广度;在解码器中引入注意力机制,进一步提高了深度估计精度;结合数据损失和结构相似性损失,提高模型训练的稳定性及收敛速度,降低模型的训练代价.实验结果表明,在KITTI数据集上与现有的模型相比,均方根误差相较于先进的算法LapDepth降低了 4.8%,训练代价降低了 36%,深度估计精度和收敛速度均有较显著地提升.
更多
关键词
deep learning,monocular depth estimation,attention mechanism,Laplacian pyramid,Laplacian residuals
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要