中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于语义空间的抽取式单文档摘要方法

文献类型:期刊论文

作者杨山; 杨雅婷; 温正阳; 米成刚
刊名厦门大学学报(自然科学版)
出版日期2019
卷号58期号:2页码:237-242
关键词文本摘要 Word2Vec TextRank 词频-逆文本频率指数 句子-原文相似度 序列到序列
ISSN号0438-0479
英文摘要

目前的抽取式单文档摘要方法未考虑原文中句子和原文语义信息相关度,针对该问题,提出一种基于语义空间的抽取式单文档摘要方法.首先,利用Word2Vec训练词向量以获取语义空间,并基于该语义空间表示句子和原文;然后,基于余弦相似度计算句子与原文相似度值,并使用TextRank和词频-逆文本频率指数(TF-IDF)模型计算原文中句子的权重;最后,将相似度值与权重相结合得到句子的最终权重值.实验结果表明,该模型摘要质量优于基于深度学习的基线系统.

CSCD记录号CSCD:6461389
源URL[http://ir.xjipc.cas.cn/handle/365002/5695]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.中国科学院新疆理化技术研究所
2.中国科学院大学计算机科学与技术学院
3.新疆民族语音语言信息处理实验室
4.乌鲁木齐市公安局网安支队
推荐引用方式
GB/T 7714
杨山,杨雅婷,温正阳,等. 基于语义空间的抽取式单文档摘要方法[J]. 厦门大学学报(自然科学版),2019,58(2):237-242.
APA 杨山,杨雅婷,温正阳,&米成刚.(2019).基于语义空间的抽取式单文档摘要方法.厦门大学学报(自然科学版),58(2),237-242.
MLA 杨山,et al."基于语义空间的抽取式单文档摘要方法".厦门大学学报(自然科学版) 58.2(2019):237-242.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。