基于词频和文本类别的互信息改进算法

Journal of Jinggangshan University(Natural Science)(2013)

引用 0|浏览7
暂无评分
摘要
分析了传统的互信息特征选择算法的不足,针对可能赋予低频特征词过高权重的问题,利用词频、集中度这两个强信息特征指标对算法进行改进,提出了一种基于词频和文本类别的互信息改进算法(Improved Mutual Information Algorithm based on Word Frequency and Text Category,简称改进的MIFC)。实验结果表明,改进的MIFC算法提取的特征空间比传统的互信息算法有更高的精确度。
更多
查看译文
关键词
feature selection,word frequency,mutual information,text category,MIFC
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要