基于统计的中文文本主题自动提取研究
文献类型:期刊论文
作者 | 张清军 ; 朱才连 |
刊名 | 四川大学学报(工程科学版)
![]() |
出版日期 | 2004 |
期号 | 3页码:97-100 |
关键词 | 主题自动提取 特征词 加权函数 |
ISSN号 | 1009-3087 |
通讯作者 | 中国科学院测量与地球物理研究所,中国科学院测量与地球物理研究所 湖北武汉430077 ,湖北武汉430077 |
中文摘要 | 文本主题自动提取是一种很有实用价值的技术,它可以有效地浓缩整个web页面,解决无线网络终端由于显示屏太小而无法显示整个网页的难题。总结了目前有关文本主题提取方面的研究成果,设计了一个特征词加权函数,在此函数中考虑了词所跨的段落数因子,同时采用非线性函数描述词长因子和词所跨的段落数因子的作用,并将加权函数应用于主题自动提取。实现了一个中文主题自动提取系统原型,通过对文本集的测试验证了加权函数的有效性。 |
公开日期 | 2012-02-13 |
源URL | [http://ir.whigg.ac.cn//handle/342008/1469] ![]() |
专题 | 测量与地球物理研究所_其他_期刊论文 |
推荐引用方式 GB/T 7714 | 张清军,朱才连. 基于统计的中文文本主题自动提取研究[J]. 四川大学学报(工程科学版),2004(3):97-100. |
APA | 张清军,&朱才连.(2004).基于统计的中文文本主题自动提取研究.四川大学学报(工程科学版)(3),97-100. |
MLA | 张清军,et al."基于统计的中文文本主题自动提取研究".四川大学学报(工程科学版) .3(2004):97-100. |
入库方式: OAI收割
来源:测量与地球物理研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。