Top Paper该研究解决了文本到图像扩散模型的计算和速度问题,使其能够在手机设备上在不到2秒的时间内运行,避免了高端GPU和云推理这些成本高昂的方式,同时也规避了隐私问题。
arXiv · Computer Vision and Pattern Recognition(2023)
Top Paper本文证明了 CoT 在实现大语言模型(LLM)推理中是不可或缺的,并从理论和实验角度揭示了 CoT 如何释放 LLM 的巨大潜力。
arXiv · Machine Learning(2023)
本文利用奖励函数和最优策略之间的映射,展示了这个受限的奖励最大化问题可以用单个阶段的策略训练来精确优化,从而在人类偏好数据上解决了一个分类问题,提出了一种称为DPO的算法。DPO算法稳定、高效且计算量轻,无需拟合奖励模型、在微调过程中从语言模型中采样或进行显著的超参数调整。
arXiv · Machine Learning(2023)
该论文介绍了一种基于图像-文本扩散模型的高保真3D头像生成方法,利用预训练的图像-文本扩散模型进行数据生成,并使用基于生成性对抗网络(GAN)的3D生成网络进行训练。
arXiv · Computer Vision and Pattern Recognition(2023)
本文介绍了一个名为OlaGPT的智能框架,旨在通过模拟人类认知的某些方面来提升大型语言模型(LLMs)在解决复杂推理问题方面的能力。
Yuanzhen Xie, Tao Xie, Mingxiong Lin, WenTao Wei, Chenglin Li, Beibei Kong,Lei Chen, Chengxiang Zhuo, Bo Hu,Zang Li arXiv · Computation and Language(2023)
论文提出了一种新的神经网络架构—Backpack语言模型,它结合了强大的建模性能和可解释性控制的接口。
arXiv · Computation and Language(2023)
arXiv · Artificial Intelligence(2023)
讨论了使用强大的专有语言模型来提高较弱的开源语言模型的方法的问题。
arXiv · Computation and Language(2023)
再推荐几条看看查看更多推荐内容再推荐几条看看添加订阅关键词设定感兴趣领域,获取更精准推送