多源文本下结合实体的事件发现方法ESP

Journal of Shanxi University(Natural Science Edition)(2019)

引用 1|浏览1
暂无评分
摘要
网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果.针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念,设计了事件核心实体识别方法,并且将事件核心实体应用到事件发现过程,提出了结合实体的事件发现方法ESP(Entity Single-Pass).该方法通过引入实体信息,丰富了多源文本中每篇文档的表达,从而提高了多源文本事件发现的效果.实验表明,在微博、新闻等数据上,我们的方法与K-means和Single-Pass方法相比,在NMI与RI两项指标上分别提高了0.2和0.3,证明了ESP算法的有效性.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要