融合多策略的军事领域中文术语抽取研究

Modern Computer(2020)

引用 1|浏览3
暂无评分
摘要
军事术语是传递军事信息的主要载体,客观反映军事领域的变化与发展,军事领域术语抽取研究对于军事信息处理有着重要意义.以军事领域中文术语抽取为研究对象,在对军事领域术语的基本特征进行深入分析的基础上提出一种结合多策略的抽取方法.该方法融合了词典、规则、统计量度和机器学习算法于一体,在语料预处理阶段使用预先构造的军事术语词典辅助分词,在抽取阶段使用改进的条件随机场模型识别候选术语,在词形、词性等特征的基础上加入词典特征、句法依存关系特征,最后综合利用语言学规则和统计方法对候选术语进行过滤,获得最终术语列表.在收集的军事演习语料上的实验结果显示,该方法取得较好的抽取结果.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要