自动构建时间基元规则库的中文时间表达式识别

Journal of Chinese Information Processing(2010)

引用 8|浏览86
暂无评分
摘要
该文提出一种基于正则文法的时间表达式识别算法:它基于"时间基元"①进行规则构建,提高了时间表达式识别的召回率;同时使用基于错误驱动思想的规则剪枝算法,削减了从训练语料带来的噪声,提高了识别的正确率,两者搭配有效提高了系统整体性能。在ACE07中文语料上的实验结果显著超过了现有水平,F-score达到89.9%。该文提出的算法具有很好的通用性和扩展性,加以改进将可以有更广泛的应用。
更多
查看译文
关键词
basic time unit,Timex2,computer application,error-driven,time expression recognition,Chinese information processing,regular expression
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要