DRTE:面向基础教育的术语抽取方法

中文信息学报(2018)

引用 1|浏览104
暂无评分
摘要
术语抽取从非结构化文本中自动抽取专业术语.该工作在中文分词、信息抽取、知识库构建中发挥着重要的作用.当前术语抽取方法很大程度上依赖于词的统计信息,由于基础教育学科中术语具有极强的长尾特性,导致基于统计的术语抽取方法很难抽取出处于尾端的术语.该文结合基础教育的学科特点,提出了DRT E:一种利用术语定义与术语关系挖掘,综合构词规则与边界检测的术语抽取方法.该文以初高中的数学课本为数据源进行术语抽取,实验结果表明我们的术语抽取方法F1值达到82.7%,相比目前的方法提高了40.8%,能够有效地在中文基础教育领域进行自动化的术语抽取.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要