面向新闻的热点话题检测方法、装置及设备
文献类型:专利
作者 | 杨雅婷![]() ![]() ![]() |
发表日期 | 2021-07-23 |
著作权人 | 中国科学院新疆理化技术研究所 |
文献子类 | 发明专利 |
英文摘要 | 本发明公开了一种面向新闻的热点话题检测方法、装置及设备,所述方法包括:针对预处理技术;将信息流划分到不同的时间窗口,通过提取标题特征和正文特征表达文本或话题;对同一时间窗口内的文本,使用凝聚层次聚类建立时间无关的话题检测模型,实现微聚类。对不同时间窗口内的话题使用单遍法建立跨时间窗口的话题检测模型,实现最终的话题聚类;最后,利用TextRank算法,通过先计算单文本的简要表达,再在单文本表达基础上进一步使用TextRank算法得到话题表达,实现对新闻自动归类,展现的目的。 |
申请日期 | 2021-03-13 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/8009] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
推荐引用方式 GB/T 7714 | 杨雅婷,张文博,董瑞,等. 面向新闻的热点话题检测方法、装置及设备. 2021-07-23. |
入库方式: OAI收割
来源:新疆理化技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。