Co-training机器学习方法在中文组块识别中的应用

JOURNAL OF CHINESE INFORMATION PROCESSING(2005)

引用 0|浏览3
暂无评分
摘要
采用半指导机器学习方法co-training实现中文组块识别.首先明确了中文组块的定义,co-training算法的形式化定义.文中提出了基于一致性的co-training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组合成一个分类体系,并与自我训练方法进行了比较,在小规模汉语树库语料和大规模未带标汉语语料上进行中文组块识别,实验结果要比单纯使用小规模的树库语料有所提高,F值分别达到了85.34%和83.41%,分别提高了2.13%和7.21%.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要