关系数据库语义集成关键技术研究
文献类型:学位论文
作者 | 刘强 |
学位类别 | 博士 |
答辩日期 | 2008-06-02 |
授予单位 | 中国科学院研究生院 |
授予地点 | 中国科学院软件研究所 |
导师 | 黄涛 |
关键词 | 关系数据库 本体 语义互操作 模式匹配 冲突消解 语义查询 |
其他题名 | Semantic Integration of Relational Databases |
学位专业 | 计算机软件与理论 |
中文摘要 | 自上世纪70年代关系数据库诞生以来,数据集成就一直是数据库领域的研究热点和难点问题。传统的数据集成研究依赖于元数据级别的模式映射和模式转换技术,较好地解决了结构级别的异构。但是,随着电子商务等web应用的出现,数据集成参与方的规模越来越大,而关系数据库模式缺乏对语义信息的显式表达能力,用户依赖于约定俗成规定数据语义的方式不再成为可能。这就造成了几个方面的问题:如何提高集成过程的自动化程度,如何保证数据集成满足用户定义的准确性要求,如何检测和消解集成过程中的语义冲突,如何提供满足用户意图的查询结果?因此,迫切需要能够克服这些困难的新方法。随着对语义web技术的深入研究和本体在数据集成领域的逐步应用,利用或基于本体解决语义互操作问题已成为可能。本文以本体为主要工具,在传统的模式匹配和模式冲突消解技术的基础上,深入研究语义级别的自动化模式匹配技术、检测和消解关系数据库集成中的语义冲突、提高数据库查询的质量。本文对关键数据模型进行定义,描述了复杂过程的规则和算法,设计了系统体系结构,并在数据集成中间件OnceDI的基础上进行了实现,研究内容可满足网络分布式环境下关系数据库语义互操作的需求,在集成准确性、自动化程度和响应质量上均得到了较好的结果。在模式匹配方面,利用WordNet本体与决策树学习相结合的方法进行属性名称匹配,这种方法基于词汇语义,区别于已有的基于模式的、基于实例的和基于结构的方法。在此基础上,根据自主构建的数据类型本体,计算数据类型的语义距离,进一步得出集成了数据类型的属性相似度。利用领域本体,还可以计算一对多的语义匹配关系。迭代的三个过程逐步提高了模式匹配的质量。在冲突检测和消解方面,首先给出了一种语义冲突的分类框架,基于该框架建立了冲突分类本体SCO。然后使用OWL本体描述语言建立关系数据库模式的语义扩展模型ESM,并给出了一种基于规则的关系数据库到ESM的自动转换方法。SCO和ESM两部分构成了语义冲突的表示模型,在此基础上,给出了语义冲突检测和消解的算法。系统实现证明,它可以有效消解大部分实际应用中的语义冲突,并且保持领域通用性和集成模型无关性。在数据库语义查询方面,已有的研究主要解决多数据库模式级别的语义异构问题,满足用户全局查询的目的。考虑数据库实例的语义,并用来提高数据库查询质量的研究尚不多见。我们定义了与数据库相关的本体,主要描述数据库实例的语义及关系,基于该本体与数据库元素的映射关系,根据语义关系的等价性,定义了查询转换的规则,应用该规则可以获取更多或者更少的查询结果,但是却更能反映用户的查询意图。本文给出了查询转换规则的正确性证明方法,并讨论了查询转换的实现。基于转换规则的方法不要求用户熟悉本体语义,不需要对DBMS进行修改和扩充,具有对所有关系数据库类型的通用性,较好地满足了提高数据库查询质量的要求。最后,本文介绍了如何在数据集成中间件OnceDI中实现语义集成的功能。我们扩展了客户端工具集,用于编辑处理各种本体;在控制中心服务器中,扩充了元数据管理功能,可以在此基础上自动生成等价的关系数据源本体,扩展了ETLJob管理模块,用于完成基于各种语法和语义匹配算法的自动化模式匹配;在集成服务器中,实现了转换函数库,用于属性冲突的消解处理。本文介绍了OnceDI的各个重要组成部分,阐释了语义集成功能的实现细节,给出了关键数据模型的数据结构,描述了复杂过程的执行流程。 |
公开日期 | 2011-03-17 |
源URL | [http://124.16.136.157/handle/311060/6670] ![]() |
专题 | 软件研究所_软件工程技术研究开发中心 _学位论文 |
推荐引用方式 GB/T 7714 | 刘强. 关系数据库语义集成关键技术研究[D]. 中国科学院软件研究所. 中国科学院研究生院. 2008. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。