谷歌浏览器插件
订阅小程序
在清言上使用

RL-STaR: Theoretical Analysis of Reinforcement Learning Frameworks for Self-Taught Reasoner.

Fu-Chieh Chang, Yu-Ting Lee, Hui-Ying Shih, Yi Hsuan Tseng,Pei-Yuan Wu

CoRR(2024)

引用 0|浏览0
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要