中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
数据库数据复制并行化方法的研究与实现

文献类型:学位论文

作者吴亚鑫
学位类别硕士
答辩日期2010-06-01
授予单位中国科学院研究生院
授予地点北京
导师孙静
关键词分布式数据库
学位专业其他专业
中文摘要数据库数据复制技术虽然给企业带来了福音,但目前的数据库数据复制方法在复制效率上难以满足企业数据瞬息万变的需求。本文提出了数据库数据复制的并行化方法。不同于串行化复制中数据库操作片段依照捕获时序逐一同步到目的数据库,数据库并行化数据复制通过识别数据库操作片段中的相关性从而建立新的并行处理时序来完成并行化复制。为了适应不同的业务模式,本文引入了两种粒度的并行化方法,即表粒度与记录粒度:表粒度以数据库表作为分析节点来建立数据库操作弱相关性模型,从而实现粗粒度的并行化;记录粒度以数据库记录作为分析节点来建立数据库操作强相关性模型,从而实现细粒度的并行化。两种粒度在识别效率和并行化程度上有着不同的平衡,能够满足不同的业务场景。 从数据库数据复制并行化方法中抽象出的数据库操作相关性模型具有良好的理论价值和应用价值,不仅适用于数据库数据复制的并行化,还可用于其他与数据库操作相关的并行化领域。 本文以提高数据库数据复制的效率为主要目标,主要研究数据库数据复制并行化方法,主要的研究内容包括以下几个方面: (1)数据库并行化数据复制体系结构 本文在充分吸收传统数据库数据复制体系结构的基础上,提出了数据库并行化数据复制体系结构,包括数据库操作片段捕获、数据并行化分发以及数据同步。 (2)基于表粒度的数据库操作弱相关性模型 本文提出了基于表粒度的数据库操作弱相关性模型,并在此模型的基础上提出了弱繁衍层次的概念,然后设计了一个数据库操作弱相关性识别算法。弱相关性模型以数据库表作为分析节点来实现粗粒度的并行化。 (3)基于记录粒度的数据库操作强相关性模型 本文提出了基于记录粒度的数据库操作强相关性模型,并在此模型的基础上提出了强繁衍层次的概念,然后设计了一个数据库操作强相关性识别算法。强相关性模型以数据库记录作为分析节点来实现细粒度的并行化。 (4)数据库并行化数据复制系统 本文采用了数据库并行化数据复制体系结构,并结合作者在数据库操作相关性方面的研究,设计并实现了一个数据库并行化数据复制系统。该系统引入的数据并行化分发策略改变了过去数据分发效率低的缺陷,从而解决了数据库数据复制效率低的瓶颈。
学科主题计算机应用
语种中文
公开日期2010-06-03
源URL[http://124.16.136.157/handle/311060/2297]  
专题软件研究所_人机交互技术与智能信息处理实验室_学位论文
推荐引用方式
GB/T 7714
吴亚鑫. 数据库数据复制并行化方法的研究与实现[D]. 北京. 中国科学院研究生院. 2010.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。