谷歌浏览器插件
订阅小程序
在清言上使用

Mixed-R1: Unified Reward Perspective for Reasoning Capability in Multimodal Large Language Models

Shilin Xu,Yanwei Li,Rui Yang,Tao Zhang, Yueyi Sun, Wei Chow, Linfeng Li, Hang Song, Qi Xu,Yunhai Tong,Xiangtai Li,Hao Fei

arxiv(2025)

引用 0|浏览0
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要