基于Web日志的政府网站热点信息挖掘技术研究
文献类型:学位论文
作者 | 孟令达 |
答辩日期 | 2013-05-24 |
授予单位 | 中国科学院大学 |
授予地点 | 中国科学院新疆理化技术研究所 |
导师 | 周喜 |
关键词 | Web 日志挖掘 民众关注热点信息 区域-频道访问度 电子政务 Web数据挖掘 关联分析 |
学位名称 | 硕士 |
学位专业 | 计算机应用技术 |
英文摘要 | 信息技术的快速发展和应用,加快了现代人的生活节奏,影响了人们的生活方式。Internet技术在个人生活、企业管理以及电子商务的应用,使人们能够更加快速和便捷的获取想要的信息,使企业具有更高的工作效率。同样应用也对国家政府部门的工作提出了快捷、高效的要求。我国的电子政务在国家支持下经过了这些年的发展在政务办公自动化和政府网站建设等方面已经取得了一定的成果,在此期间积累了大量的数据。尤其政府部门的门户网站,更是积累了海量用户访问日志。如何利用分析这些历史数据,进而发现其潜在的规律,为今后政府网站的发展提供科学指导成为一个重要课题。 Web数据挖掘技术可有效的利用Web数据,使其发挥价值,它是数据挖掘技术和Web技术的结合。其主要目的是分析挖掘Web数据中潜在的有价值的信息或规律。Web数据挖掘中的Web日志挖掘技术是对网站运行过程产生的日志进行分析处理,发现数据背后有价值的模型,将其应用于网站结构优化、性能优化方面,从而为用户提供优质的服务。 本文在政府网站Web日志挖掘方面做了相关研究。首先,介绍数据挖掘技术、Web数据挖掘的基本概念和分类以及Web日志挖掘的应用领域和实现过程。然后,通过分析现有Web日志挖掘算法,针对政府网站的内容特点,定义了区域及区域访问度、频道及频道访问度的概念和计算方法以及基于区域-频道访问的概念设计Web访问矩阵,进而设计了基于区域-频道访问度的民意热点信息挖掘算法(PHIMA)。采用新疆昆仑网政府网站的Web日志数据进行对比试验,验证该算法有效性;分析影响该算法性能的因素,验证算法的性能优越性。最后,以PHIMA算法为基础,设计基于该算法的政府网站挖掘系统框架和功能框架,为基于PHIMA算法的政府网站日志挖掘系统开发提供指导。 |
公开日期 | 2013-05-31 |
页码 | 67 |
源URL | [http://ir.xjipc.cas.cn/handle/365002/2495] ![]() |
专题 | 新疆理化技术研究所_多语种信息技术研究室 |
推荐引用方式 GB/T 7714 | 孟令达. 基于Web日志的政府网站热点信息挖掘技术研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2013. |
入库方式: OAI收割
来源:新疆理化技术研究所
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。