结合注意力机制的Bi-LSTM-CRF中文电子病历命名实体识别

Journal of Computer Applications(2020)

引用 6|浏览8
暂无评分
摘要
在中文电子病历命名实体识别任务中,为了消除传统命名实体识别方法高度依赖人工提取特征这一不足,设计了双向长短时记忆(Bi-LSTM)网络与条件随机场(CRF)结合的网络模型,并在联合网络的基础上添加注意力机制,从而优化实体识别准确率.首先,将中文电子病历数据集进行脱敏处理及序列标注等预处理;其次,结合词嵌入技术将电子病历文本序列进行词向量化表示,并利用Bi-LSTM网络模型构造包含前向和后向文本的语义特征;然后,将双向特征序列输入到注意力层,利用注意力机制对文本特征向量的语义编码分配不同的注意力权重,进一步强化当前信息与上下文信息之间潜在的语义关联性;最后,输入到CRF层中,由此提取出实体.实验结果表明,该注意力机制与Bi-LSTM-CRF模型融合的新方法能有效提高中文电子病历命名实体识别的准确率.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要