说话人重识别中的基频和共振峰联合还原方法

Computer Technology and Development(2023)

引用 0|浏览1
暂无评分
摘要
说话人匿名技术的出现,对基于声纹的生物特征识别造成了巨大的安全威胁.对于利用各种变声工具实施的说话人匿名,匿名语音中的说话人个性特征相比原始语音发生了显著改变,会严重影响说话人识别的效果.针对现有说话人重识别方法存在的语音还原手段单一、在变声工具类型未知情况下的匿名语音还原效果尚不明确等问题,提出了一种基于基频和共振峰联合还原的说话人变声匿名重识别方法.该方法在基频逆变换变声还原的基础上,引入McAdams系数调整语音的共振峰,同时使用基于x-vector的说话人识别模型进行声纹相似度评分,提高了黑盒变声匿名条件下还原语音与真实语音的声学特征相似度,增强了说话人识别系统对不同类型变声匿名语音的重识别能力.实验结果表明,提出的方法对四种音频编辑软件和三种真实变声器材匿名语音的重识别效果均优于现有基线重识别方法.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要