基于聚类改进的 KN N文本分类算法

Qingping Zhou,Changgeng Tan, Hongjun Wang, Miaoxiang Zhan

Application Research of Computers(2016)

引用 44|浏览1
暂无评分
摘要
传统的KN N文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KN N算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KN N算法在文本分类中的效率,提出一种基于聚类的改进KN N算法。算法开始之前采用改进χ2统计量方法进行文本特征提取,再依据聚类方法将文本集聚类成几个簇,最后利用改进的KN N方法对簇类进行文本分类。实验对比与分析结果表明,该方法可以较好地进行文本分类。
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要