中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
文本摘要常用数据集和方法研究综述

文献类型:期刊论文

作者侯圣峦; 张书涵; 费超群
刊名中文信息学报
出版日期2019
卷号33.0期号:005页码:1
关键词文本摘要 自然语言处理 机器学习 人工智能
ISSN号1003-0077
英文摘要文本摘要成为人们从互联网上海量文本信息中便捷获取知识的重要手段。现有方法都是在特定数据集上进行训练和效果评价,包括一些公用数据集和作者自建数据集。已有综述文献对现有方法进行全面细致的总结,但大多都是对方法进行总结,而缺少对数据集的详细描述。该文从调研数据集的角度出发,对文本摘要常用数据集及在该数据集上的经典和最新方法进行综述。对公用数据集的综述包括数据来源、语言及获取方式等,对自建数据集的总结包括数据规模、获取和标注方式等。对于每一种公用数据集,给出了文本摘要问题的形式化定义。同时,对经典和最新方法在特定数据集上的实验效果进行了分析。最后,总结了已有常用数据集和方法的现状,并指出存在的一些问题。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/27902]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
侯圣峦,张书涵,费超群. 文本摘要常用数据集和方法研究综述[J]. 中文信息学报,2019,33.0(005):1.
APA 侯圣峦,张书涵,&费超群.(2019).文本摘要常用数据集和方法研究综述.中文信息学报,33.0(005),1.
MLA 侯圣峦,et al."文本摘要常用数据集和方法研究综述".中文信息学报 33.0.005(2019):1.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。