从视觉到文本:图像描述生成的研究进展综述

Zhongyu WEI,Zhihao FAN,Ruize WANG, Yijing CHENG, Wangrong ZHAO,Xuanjing HUANG

Journal of Chinese Information Processing(2020)

引用 3|浏览19
暂无评分
摘要
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题.该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述.该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结.最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要