基于频谱位移模块的环境声音识别方法

Electronic Measurement Technology(2022)

引用 0|浏览0
暂无评分
摘要
针对卷积操作只能提取局部频谱信息,不能有效地挖掘频谱之间相关信息的问题,提出了一种基于频谱位移模块的神经网络.该网络采用密集卷积神经网络的架构,并在支路上使用频谱位移模块实现频谱信息之间的交互.利用这种频谱移位取代了频谱间的下采样操作,实现了频谱的全局化特征提取,同时避免了下采样过程中信息的丢失,进一步地提高了频谱特征图质量.并在公开的数据集ESC10和ESC50上验证频谱位移密集模块,在两种数据集的分类准确度分别达到了 96.00%和88.75%,与原有的网络相比准确度分别提升了 2.1%和2.25%.实验结果表明,和现有的其他卷积神经网络方法相比,所提出的网络能够更好有效地挖掘全局时频信息,具有更高的识别准确率.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要