中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于内容和分层结构的XML文件自动分类方法

文献类型:期刊论文

作者唐凯
刊名计算机工程与应用
出版日期2007
卷号43.0期号:003页码:168
关键词特征词 文件自动分类 分层结构
ISSN号1002-8331
英文摘要提出了一种以XML文件内在的分层结构为基础的文件分类方法,井与改良的VSM方击的实验结果进行了比较。和以往XML文件的分类方法不同的是.此方法更加注重XML文件特有的结构信息。首先利用TF-IDF方法针对XML文件非蛄构的信息产生一般特征集,然后再针对XML文件各个屡次重要性赋予一定的权重。从而产生层次特征集,然后根据一些领域知识,产生知识特征榘。将三个特征集结合起来对XML进行分类。试验结果表明,这种方法比改良的VSM方法在分类的准确性方面有大幅的提高。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/36209]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
唐凯. 基于内容和分层结构的XML文件自动分类方法[J]. 计算机工程与应用,2007,43.0(003):168.
APA 唐凯.(2007).基于内容和分层结构的XML文件自动分类方法.计算机工程与应用,43.0(003),168.
MLA 唐凯."基于内容和分层结构的XML文件自动分类方法".计算机工程与应用 43.0.003(2007):168.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。