中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
利用Medline文摘数据库研究文本分类

文献类型:期刊论文

作者霍东云 ; 聂峰光 ; 郭力
刊名计算机与应用化学
出版日期2007
期号09页码:1281-1284
关键词Medline 文本分类 SVM
中文摘要文本分类领域的困难,在于如何获得大量人工标记好的分类样本数据集,Medline数据库在专家的长期维护下,具有完善的基于MeSH(Medical Subject Headings)的分类体系,以及大量的文摘,可用来制作分类样本数据集。本文介绍和研究Medline数据库,提出如何利用它构建良好的分类模型,实验表明,利用Medline文摘数据库,通过Major标记,特征项数目采用5000,训练样本采用600,利用SVM分类器,可得较好的分类模型,从而为文本分类研究提供一种实用、高效的数据集制作方式。
公开日期2013-10-17
版本出版稿
源URL[http://ir.ipe.ac.cn/handle/122111/3694]  
专题过程工程研究所_研究所(批量导入)
推荐引用方式
GB/T 7714
霍东云,聂峰光,郭力. 利用Medline文摘数据库研究文本分类[J]. 计算机与应用化学,2007(09):1281-1284.
APA 霍东云,聂峰光,&郭力.(2007).利用Medline文摘数据库研究文本分类.计算机与应用化学(09),1281-1284.
MLA 霍东云,et al."利用Medline文摘数据库研究文本分类".计算机与应用化学 .09(2007):1281-1284.

入库方式: OAI收割

来源:过程工程研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。