基于内容和分层结构的XML文件自动分类方法
文献类型:期刊论文
作者 | 唐凯 |
刊名 | 计算机工程与应用
![]() |
出版日期 | 2007 |
卷号 | 43.0期号:003页码:168 |
关键词 | 特征词 文件自动分类 分层结构 |
ISSN号 | 1002-8331 |
英文摘要 | 提出了一种以XML文件内在的分层结构为基础的文件分类方法,井与改良的VSM方击的实验结果进行了比较。和以往XML文件的分类方法不同的是.此方法更加注重XML文件特有的结构信息。首先利用TF-IDF方法针对XML文件非蛄构的信息产生一般特征集,然后再针对XML文件各个屡次重要性赋予一定的权重。从而产生层次特征集,然后根据一些领域知识,产生知识特征榘。将三个特征集结合起来对XML进行分类。试验结果表明,这种方法比改良的VSM方法在分类的准确性方面有大幅的提高。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/36209] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 唐凯. 基于内容和分层结构的XML文件自动分类方法[J]. 计算机工程与应用,2007,43.0(003):168. |
APA | 唐凯.(2007).基于内容和分层结构的XML文件自动分类方法.计算机工程与应用,43.0(003),168. |
MLA | 唐凯."基于内容和分层结构的XML文件自动分类方法".计算机工程与应用 43.0.003(2007):168. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。