基于多通道注意力机制的文本分类模型

Microelectronics & Computer(2022)

引用 0|浏览6
暂无评分
摘要
为解决卷积神经网络(CNN)和循环神经网络(RNN)处理文本分类任务时,由于文本特征稀疏造成的关键特征信息丢失、模型性能不高和分类效果不佳等问题.提出一种基于多通道注意力机制的文本分类模型,首先利用字词融合的形式进行向量表示,然后利用CNN和BiLSTM提取文本的局部特征和上下文关联信息,接着以注意力机制对各通道的输出信息进行特征加权,凸显特征词在上下文信息的重要程度,最后将输出结果进行融合,并使用softmax计算文本类别概率.在数据集的对比实验结果表明,所提模型的分类效果更为优异.相较于单个通道的模型分类效果,F1值分别提升1.44%和1.16%,验证了所提模型在处理文本分类任务的有效性.该模型互补了 CNN和BiLSTM提取特征的缺点,有效的缓解了 CNN丢失词序信息和BiLSTM处理文本序列的梯度问题,能够有效地统筹文本的局部和全局特征,并进行关键信息凸显,从而获取更为全面的文本特征,因此适用于文本分类任务.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要