中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
WWW元搜索引擎研究及实验系统LMSE

文献类型:学位论文

作者侯玉娜
学位类别博士
答辩日期2000
授予单位中国科学院软件研究所
授予地点中国科学院软件研究所
关键词元搜索引擎 索引数据库 超级链接 蜘蛛
学位专业计算机应用技术
中文摘要本文对World Wide Web的产生、发展及其工作原理作了概述,引出了WWW的网络检索问题,并研究了当前主要的搜索引擎,分析了它们共有的特性和各自的优缺点。由于WWW太大又没有良好的结构及Web服务器的自治性,当前的主要搜索引擎的单个索引数据库难以涵盖所有的Web资源,并且由于各搜索引擎所采用的文档相关性评估标准不同,因此查询不可能是精确的,这样便给用户来极大的不便。如何将多个搜索引擎的结果综合起来,从中选取与用户查询相关性更强的条目,排除相关性很小的条目,并以统一的界面呈现给用户将是一项很有意义的工作。本文所做的工作正是在这样一个背景下产生的。除了当前的主流索引数据库之外,还有一种元搜索引擎。元搜索(Meta-Search)查询是一种以现有索引信息系统为基础的查询方法,其一般做法是把用户的提问同时传送至多个包含数据库的搜索引擎,然后对各搜索引擎返回的结果进行去重、排序等整理,最终响应给检索用户。本文研究了元搜索引擎的一般结构和关键技术,提出了基于链接模型的元搜索引擎。这种元搜索引擎与其他元搜索引擎的区别在于对各索引系统返回结果的处理上采用了一种基于链接的算法-HITS(Hyperlink_Induced Topic Search)算法。该算法在计算各个网页与用户的查询请求的相关度上,除了考虑网页的文本信息之外还充分利用了HTML文件中的超级链接信息,克服了传统的基于纯文本的搜索方法的局限性。本文也介绍了实验系统的实现情况,通过实验系统的测试数据证明了HITS算法在计算相关度上的有效性。同时,实验数据也充分证明了元搜索引擎与传统的搜索引擎相比在数据覆盖面上的优越性。本文从一定程度上解决了搜索引擎在查全率和查准率方面的问题。最后,对论文做了总结并提出了进一步工作的方向。
语种中文
公开日期2011-03-17
页码60
源URL[http://ir.iscas.ac.cn/handle/311060/5888]  
专题软件研究所_中科院软件所_中科院软件所
推荐引用方式
GB/T 7714
侯玉娜. WWW元搜索引擎研究及实验系统LMSE[D]. 中国科学院软件研究所. 中国科学院软件研究所. 2000.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。