基于增强特征金字塔网络的场景文本检测算法

Computer Science(2022)

引用 1|浏览7
暂无评分
摘要
场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛.现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力.为解决上述问题,提出了一种基于增强特征金字塔网络的场景文本检测算法.该算法包括比率不变特征增强(Ratio Invariant Feature Enhanced,RIFE)模块和重建空间分辨率(Rebuild Spatial Resolution,RSR)模块.RIFE模块作为残差分支,增强了网络的高层语义信息传递,提高了分类能力,降低了误报率和漏捡率.RSR模块重建多层特征分辨率,利用丰富的空间信息改进边界位置.实验结果表明,所提算法提升了在多方向文本数据集ICDAR2015、弯曲文本数据集Totaltext以及长文本数据集MSRA-TD500上的检测能力.
更多
查看译文
关键词
scene text detection|feature pyramid network|semantic information|spatial information|boundary location
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要