简要案情的命名实体识别技术

Computer Systems & Applications(2022)

引用 0|浏览0
暂无评分
摘要
简要案情是公安机关为提高"协同办案系统"录入信息质量,确保信息检索与案件串并工作高效开展而对案情记载的简要描述,其中各类实体间包含了大量与受害者和作案人相关的案情信息.因此,对简要案情文本的深度挖掘是掌握案件始末和分析案情的有效手段之一.简要案情文本中的实体稠密分布、实体间相互嵌套以及实体简称,给准确捕捉案件实体带来了巨大的挑战.针对简要案情文本的特殊性和复杂性,本文对字符向量生成的方法进行了改进,提出了RC-BiLSTM-CRF(Roberta-CNN-BiLSTM-CRF)网络架构,相比于主流的"Bert-BiLSTM-CRF"架构,该架构可以对字符向量特征进行提取,解决了通过预训练模型带来的字符向量冗长的问题,通过减少模型的参数量进而提高了模型整体参数的收敛速度.对比实验选用5种主流的架构在湖南省省公安机关提供的简要案情数据集上进行比较,本文提出的方法在准确率、召回率和F1值上均为最优,F1值达到了88.02%.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要