基于多颗粒度文本表征的中文命名实体识别方法

TIAN Yu,ZHANG Guiping,CAI Dongfeng, CHEN Huawei,SONG Yan

Journal of Chinese Information Processing(2022)

引用 0|浏览2
暂无评分
摘要
中文命名实体识别常使用字符嵌入作为神经网络模型的输入,但是中文没有明确的词语边界,字符嵌入的方法会导致部分语义信息的丢失.针对此问题,该文提出了一种基于多颗粒度文本表征的中文命名实体识别模型.首先,在模型输入端结合了字词表征,然后借助N-gram编码器挖掘N-gram中潜在的成词信息,有效地联合了三种不同颗粒度的文本表征,丰富了序列的上下文表示.该文在Weibo、Resume和OntoNotes4数据集上进行了实验,实验结果的F1值分别达到了72.41%、96.52%、82.83%.与基准模型相比,该文提出的模型具有更好的性能.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要