词向量和语义知识相结合的汉语未登录词语义预测研究

Data Analysis and Knowledge Discovery(2020)

引用 0|浏览1
暂无评分
摘要
[目的]将词向量和语义知识相结合,提高未登录词语义预测的准确性.[方法]抓取含有未登录词网页的语料,利用Word2Vec等模型得到词语的分布式表示信息,再结合构词语义知识对候选词进行中心词和词性过滤,实现未登录词的语义预测.[结果]在人民日报语料未登录词测试集上的实验结果表明,模型预测正确率可达87.5%,高于只使用词语内部知识的模型和只使用外部分布信息的词向量模型.[局限]无法预测语义不透明的未登录词.[结论]将携带词语外部信息的词向量与词语内部特征相结合,显著提高了未登录词语义预测的正确率,说明词语内、外部信息对于语义的组成有重要作用.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要