一种基于LDA模型的关键词抽取方法
文献类型:期刊论文
作者 | 朱泽德2; 李淼3; 张健3; 曾伟辉3; 曾新华3 |
刊名 | 中南大学学报. 自然科学版
![]() |
出版日期 | 2015 |
卷号 | 46 |
关键词 | 信息抽取 关键词抽取 LDA模型 主题相似性 |
ISSN号 | 1672-7207 |
其他题名 | A LDA-based approach to keyphrase extraction |
英文摘要 | 为解决现有方法未能综合考察文档主题的全面性、关键词的可读性以及差异性,提出一种基于文档隐含主题的关键词抽取新算法TFITF。算法根据大规模语料产生隐含主题模型计算词汇对主题的TFITF权重并进一步产生词汇对文档的权重,利用共现信息排序和选择相邻词汇形成候选关键短语,再使用相似性排除隐含主题一致的冗余短语。此外,从文档统计信息、词汇链和主题分析3方面来进行关键词抽取的对比测试,实验在1 040篇中文摘要及5 408个关键词构成的测试集上展开。结果表明,算法有效地提高文档关键词抽取的准确率与召回率。 |
语种 | 中文 |
CSCD记录号 | CSCD:5501277 |
源URL | [http://ir.hfcas.ac.cn:8080/handle/334002/99438] ![]() |
专题 | 中国科学院合肥物质科学研究院 |
作者单位 | 1.中国科学院合肥智能机械研究所 2.中国科学技术大学自动化系 3.中国科学院合肥智能机械研究所 4.中国科学院合肥智能机械研究所 5.中国科学院合肥智能机械研究所 |
推荐引用方式 GB/T 7714 | 朱泽德,李淼,张健,等. 一种基于LDA模型的关键词抽取方法[J]. 中南大学学报. 自然科学版,2015,46. |
APA | 朱泽德,李淼,张健,曾伟辉,&曾新华.(2015).一种基于LDA模型的关键词抽取方法.中南大学学报. 自然科学版,46. |
MLA | 朱泽德,et al."一种基于LDA模型的关键词抽取方法".中南大学学报. 自然科学版 46(2015). |
入库方式: OAI收割
来源:合肥物质科学研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。