数据驱动和模型驱动的时空数据挖掘:分别以交通流量数据和传染病数据为例
文献类型:学位论文
作者 | 韩卫国 |
答辩日期 | 2005-08-31 |
文献子类 | 学术型学位 |
授予单位 | 中国科学院研究生院 |
授予地点 | 中国科学院地理科学与资源研究所 |
导师 | 王劲峰 ; 胡建军 |
关键词 | 数据挖掘 时空数据挖掘 数据可视化 数据预处理 分类规则 聚类分析 时空自回归移动平均模型 刚性微分方程组 传染病时空模型 传播机理 |
学位名称 | 博士 |
学位专业 | 地图学与地理信息系统 |
英文摘要 | 地理信息系统、遥感、全球定位系统和数字通信等技术的发展积累了海量的时空数据,这些数据呈现复杂的时间关系和空间关系,而且是从连续的时空数据中离散化抽样提取并存储,具有多源、多变量、异构、历史、海量、多尺度、多时相等特点。由于缺乏有效的时空数据分析技术,其中隐含的知识并未被充分认识和利用,如何有效地分析这些时空数据,挖掘其中有用的信息,为时空数据挖掘研究提出了许多挑战性的课题。 本论文的研究是以社会生活中普遍关心的交通和传染病问题为出发点,以时空数据挖掘的一般过程为主线,针对交通时空数据和传染病时空数据的不同特点,分别采用数据驱动和模型驱动的数据挖掘方法对进行知识发现,重点实现数据预处理、数据可视化探索分析、分类规则发现、聚类分析、趋势预测和参数反演等技术和方法。 动态交通流数据的时空数据挖掘在智能交通系统的决策支持中起着举足轻重的作用,在研究中,利用数据仓库技术有效地组织这些数据,采用不同的数据驱动的数据挖掘方法发掘其中隐含的交通流时空规律,辅助交通信号控制、道路规划、出行参考、交通诱导等的决策。研究成果包括: (1) 采用星形模式设计交通流数据仓库,便于直观地分析数据趋势和内在规律。采用不同的确定性方法和随机性方法插补交通流量数据中的缺失值,并比较和分析这些方法的优缺点; (2) 采用多种数据可视化方法从不同空间尺度对交通流量数据进行可视化探索分析,揭示交通流数据中隐含的内在联系与演化规律; (3) 采用C5.0分类算法进行分类规则挖掘,生成拥堵路口交通流量规律的分类决策树,建立定性知识与定量知识之间的联系; (4) 利用可视化探索分析的结果,采用不同聚类算法对路口和主干道的交通流量进行聚类分析,把呈现相似交通流模式的时段或路段分组,辅助交通信号控制方案设计; (5) 基于历史交通流量数据来挖掘交通网络中各路口交通流量间的关联关系,建立这些路口交通流量间时空关系的STARMA模型,用于区域交通流的短时预测和时空分析。 不同类型传染病的时空传播过程基本遵循一般的时空传播机理,据此建立传染病传播数学模型,通过模型驱动的数据挖掘方法来反演各种传播参数,提出模拟退火法和刚性方程求解算法相结合的大型刚性微分方程组求解算法。研究成果包括: (1) 改进传统的SEIR模型,以公布的北京SARS数据来验证,反演有关SARS的传播参数,模拟实际传播过程,评估政府防制措施; (2) 通过不同的传染病时空监测数据集来验证时空SIR模型,反演这些不同传染病传播案例的时空传播参数,预测传染病的时空传播趋势,模拟各种防控措施下的不同场景,认识传染病传播的时空规律。 |
语种 | 中文 |
公开日期 | 2010-12-16 |
页码 | 160 |
源URL | [http://192.168.22.105/handle/311030/106] ![]() |
专题 | 地理科学与资源研究所_研究生部 |
推荐引用方式 GB/T 7714 | 韩卫国. 数据驱动和模型驱动的时空数据挖掘:分别以交通流量数据和传染病数据为例[D]. 中国科学院地理科学与资源研究所. 中国科学院研究生院. 2005. |
入库方式: OAI收割
来源:地理科学与资源研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。