订阅小程序

旧版功能

立即登录

学术主页个人账号

我的关注论文收藏浏览历史

End-to-end Audio Visual Scene-aware Dialog Using Multimodal Attention-based Video Features.

Chiori Hori,Huda Alamri,Jue Wang,Gordon Wichern,Takaaki Hori,Anoop Cherian,Tim K. Marks,Vincent Cartillier,Raphael Gontijo Lopes,Abhishek Das,Irfan Essa,Dhruv Batra,Devi Parikh

IEEE International Conference on Acoustics, Speech, and Signal Processing（2018）

引用 149|浏览286

关键词

Audio visual scene-aware dialog,Visual QA,Video description,End-to-end modeling

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要