谷歌浏览器插件
订阅小程序
在清言上使用

Beware of Your Po! Measuring and Mitigating AI Safety Risks in Role-Play Fine-Tuning of LLMs

Weixiang Zhao, Yulin Hu,Yang Deng, Jiahe Guo, Xingyu Sui, Xinyang Han,An Zhang,Yanyan Zhao,Bing Qin,Tat-Seng Chua,Ting Liu

CoRR(2025)

引用 0|浏览10
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要