利用Medline文摘数据库研究文本分类
文献类型:期刊论文
作者 | 霍东云 ; 聂峰光 ; 郭力 |
刊名 | 计算机与应用化学
![]() |
出版日期 | 2007 |
期号 | 09页码:1281-1284 |
关键词 | Medline 文本分类 SVM |
中文摘要 | 文本分类领域的困难,在于如何获得大量人工标记好的分类样本数据集,Medline数据库在专家的长期维护下,具有完善的基于MeSH(Medical Subject Headings)的分类体系,以及大量的文摘,可用来制作分类样本数据集。本文介绍和研究Medline数据库,提出如何利用它构建良好的分类模型,实验表明,利用Medline文摘数据库,通过Major标记,特征项数目采用5000,训练样本采用600,利用SVM分类器,可得较好的分类模型,从而为文本分类研究提供一种实用、高效的数据集制作方式。 |
公开日期 | 2013-10-17 |
版本 | 出版稿 |
源URL | [http://ir.ipe.ac.cn/handle/122111/3694] ![]() |
专题 | 过程工程研究所_研究所(批量导入) |
推荐引用方式 GB/T 7714 | 霍东云,聂峰光,郭力. 利用Medline文摘数据库研究文本分类[J]. 计算机与应用化学,2007(09):1281-1284. |
APA | 霍东云,聂峰光,&郭力.(2007).利用Medline文摘数据库研究文本分类.计算机与应用化学(09),1281-1284. |
MLA | 霍东云,et al."利用Medline文摘数据库研究文本分类".计算机与应用化学 .09(2007):1281-1284. |
入库方式: OAI收割
来源:过程工程研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。