中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于内容模型图的XML Schema Definition的提取方法

文献类型:期刊论文

作者宁静 ; 刘杰 ; 叶丹
刊名计算机科学
出版日期2010
卷号37期号:6页码:179-185
关键词XML XML Schema Definition 模式提取 内容模型XML XML schema definition Schema extraction Content model
ISSN号1002-137X
其他题名novel approach for extracting xml schema definition based on content model graph
中文摘要使用XML Schema能够对XML文档进行有效性验证以及对查询、转换等操作进行优化,但是实际应用中大量XML文档缺失关联的Schema。提出了一种根据XML文档自动提取对应的XML Schema Definition(XSD)的方法XSDInfer,先根据合并规则将XML解析过程中分析得到的模式信息记录在内容模型图中,再根据生成规则将其转化为内容模型表达式,进而得到XSD。XSDInfer能够在内存消耗比较少的情况下快速地处理超大规模、深度嵌套的XML文档,同时支持XSD的上下文相关的内容模型,提取出的XSD也具有更好的可读性。实验表明,与同类方法相比,XSDInfer具有更好的可扩展性和表达能力。
学科主题Computer Science
语种中文
公开日期2011-05-23
附注Although XML Schema can be used to perform validation, querying and transformation on XML documents, a lot of XML documents in real applications have no XML Schema defined.This paper presented an approach, XSDInfer, to extract XML Schema Definition (XSD) from XML documents automatically.Firstly, schema information harvested from XML parsing was merged into the Content Model Graphs by applying rules.Then the graphs were transformed to content model expressions to generate the XSD.XSDInfer can scale to very large and deep recursive XML documents.It supports the context-sensitive content model, and the generated XSD is more human-readable.Experiments show that XSDInfer achieves better performance both in scalability and expressiveness in contrast to the previous techniques
源URL[http://124.16.136.157/handle/311060/10070]  
专题软件研究所_软件工程技术研究开发中心 _期刊论文
推荐引用方式
GB/T 7714
宁静,刘杰,叶丹. 一种基于内容模型图的XML Schema Definition的提取方法[J]. 计算机科学,2010,37(6):179-185.
APA 宁静,刘杰,&叶丹.(2010).一种基于内容模型图的XML Schema Definition的提取方法.计算机科学,37(6),179-185.
MLA 宁静,et al."一种基于内容模型图的XML Schema Definition的提取方法".计算机科学 37.6(2010):179-185.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。