多源文本下结合实体的事件发现方法ESP
文献类型:期刊论文
作者 | 秦宇君; 史存会; 刘悦![]() ![]() |
刊名 | 山西大学学报:自然科学版
![]() |
出版日期 | 2019 |
卷号 | 42.0期号:1.0页码:41 |
关键词 | 事件发现 事件核心实体 多源文本 文本聚类 |
ISSN号 | 0253-2395 |
英文摘要 | 网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果。针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念,设计了事件核心实体识别方法,并且将事件核心实体应用到事件发现过程,提出了结合实体的事件发现方法 ESP(Entity Single-Pass)。该方法通过引入实体信息,丰富了多源文本中每篇文档的表达,从而提高了多源文本事件发现的效果。实验表明,在微博、新闻等数据上,我们的方法与K-means和SinglePass方法相比,在NMI与RI两项指标上分别提高了0.2和0.3,证明了ESP算法的有效性。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/28806] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 1.中国科学院 2.中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 秦宇君,史存会,刘悦,等. 多源文本下结合实体的事件发现方法ESP[J]. 山西大学学报:自然科学版,2019,42.0(1.0):41. |
APA | 秦宇君,史存会,刘悦,俞晓明,&程学旗.(2019).多源文本下结合实体的事件发现方法ESP.山西大学学报:自然科学版,42.0(1.0),41. |
MLA | 秦宇君,et al."多源文本下结合实体的事件发现方法ESP".山西大学学报:自然科学版 42.0.1.0(2019):41. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。