中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
知识发现的图模型方法

文献类型:学位论文

作者李刚
学位类别博士
答辩日期2001
授予单位中国科学院软件研究所
授予地点中国科学院软件研究所
关键词图模型 有向图模型 知识发现 概率依赖关系计算智能
学位专业计算机软件与理论
中文摘要作为概率论和图论相结合的产物,图模型理论为解决应用数学和工程中的不确定性、复杂性问题提供了直观而自然的方法。近年来它逐步成为数据发掘与知识发现领域中一个不容忽视的方向。根据“基于有向图模型的知识发现”框架,本方研究图模型在知识发现领域的应用理论基础,包括离散化预处理、结构学习、参数学习、模型解释等四个方面。首先,本文分别提出了连续数值属性的无监督离散化算法和有监督离散化算法。无监督离散化算法基于混合概率模型,它能够在缺少先验知识和参考属性时自动离散化数值区间:首先建立属性值的混合概率模型,然后采用EM算法来确定该模型的参数,最后利用贝叶斯因子寻求最佳区间数目。有监督离散化算法-加权信息损耗离散化算法,是决策树离基化算法的一种扩展,但采用了ChiMerge算法中的自底向上离散化方式。然后,本文从概率密度函数逼近的角度对有向图模型的结构学习进行了理论分析,归纳出“最大相互信息原则”,分析了运用该原则进行结构学习时的性质,并提出了“附加惩罚出数的最大相互信息原则”,进而提出了有向图模型结构学习的演化算法,该算法可以结合两类先验知识以提高学习效率,并设计了一系列修正算子,以保证由已有拓扑结构繁衍出的新结构仍然是符合要求的拓扑结构,而且不违背先验知识。针对有向图模型的参数学习,本文提出基于复合计算智能的方法,设计了各节点处条件概率密度的人工神经网络表示方法,使得参数学习时不再要求参数满足局部无关性,也不再需要用户指定先验参数,进而提出了该人工神经网络的演化训练算法,从而确定有向图模型各节点自参数的值。此外,本文还探讨了有向图模型的模型解释问题,分别提出了概率依赖关系描述、条件独立关系的自然语言描述方法。最后,本方介绍了一个概率依赖关系发砚系统原型工具Dr.Miner的设计和实现。
语种中文
公开日期2011-03-17
页码114
源URL[http://ir.iscas.ac.cn/handle/311060/7598]  
专题软件研究所_中科院软件所_中科院软件所
推荐引用方式
GB/T 7714
李刚. 知识发现的图模型方法[D]. 中国科学院软件研究所. 中国科学院软件研究所. 2001.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。