中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于Softbot的Web信息获取方法研究

文献类型:学位论文

作者刘瑞虹
学位类别博士
答辩日期1998
授予单位中国科学院软件研究所
授予地点中国科学院软件研究所
关键词Web信息获取 多Softbot体系结构(MSA) We信息获取模式 通讯原语 Web信息领域分析 Web信息主题 企业Intranet V群用户
学位专业计算机软件
中文摘要自从1990年12月世界上第一个Web软件在Steven Job的NeXT计算机系统上诞生以来,Web技术及其应用在世界范围内以惊人的速度迅速扩展,现在其已渗透到了工作生活的各个领域。面对如此众多的Web服务器与其上面丰富的Web信息资源,如何有效快捷地进行Web信息获取变的越来越重要。特别是随着Intranet日益的广泛应用,出现了以企业员工为主体的用户群,他们在Internet上形成了以企业为单位的集体行为操作特征。而已有的Web信息获取软件工具还不能充分满足企业用户群的Web信息获取需求。为了从根本上解决此问题,必须发展针对企业Intranet 的Web信息获取机制。在Internet/Intranet环境下,进行有效的Web信息的获取是当今软件技术一个重要研究方向。本文结合所承担的国家“九五”重点科技攻关计划(96-743-01-01-05)专题“网络信息获取前后服务处理技术”和“金桥”工程项目的“Web信息获取系统”开发任务,采用Softbot(软件机器人)技术,对基于企业Intranet的Web信息获取方法进行了研究。论文的主要工作包括以下几个方面:1. 分析了现有Web信息获取系统采用的技术和服务现象。认为Web信息获取从技术上经历了分类目录方法、搜索引擎方法、元搜索引擎方法的演化过程;从服务对象上经历了个体用户向区域用户,群体用户的发展。然后从Web信息获取的技术方法和服务对象两个方面探讨了Web信息获取的新发展方向,即智能化的Web信息获取和Intranet范围的群体用户。2. 综述了Web信息特征和Web信息获取特征。在此基础上,给出了现有Web信息获取的概念模式分类和用户分类。目前存在的主要Web信息获取系统都是面向个体用户的,信息内容也趋向于一般化,由于Web信息呈指增长,因此建立一个包括全部Web信息内容的搜索引擎几乎是不可能的。为了克服这些困难,Web信息获取向分专业方向发展是一种趋势。而企业Intranet的迅速发展,使得面向Intranet的Web信息获取变的日趋重要。3. 对Softbot进行了明确的定义。对Softbot的组成、功能和基本结构进行了研究,采用BNF对Softbot结构进行了详细的定义,详细分析描述了Softbot的内部运行机制,在此基础上对多Softbot体系结构(MSA)的特点、分类和交互进行了研究,给出了用通讯原语(CP)和黑板结构进行Softbot之间的信息交流的具体方式。4. 提出了基于Intranet的Web信息获取模式和Web信息获取模型IBMWIR。基于Intranet的Web信息获取模式的核心是把企业业务活动所需要的Web信息动态收集在Intranet内的服务器上。同时给出了采用多Softbot体系结构(MSA)构造设计的基于Intranet的Web信息获取模型IBMWIR。在IBMWIR中,探讨了根据Web信息主题词集,利用记者类Softbot的派驻,驻留等手段对Web信息数据库内容进行实时更新的运行机制。5. 提出了Web信息领域分析的概念。Web信息领域分析就是得到企业的Web信息主题(WIS)的过程,其在进行企业级Web信息获取的过程中起着非常重要的作用。并给出了企业Web信息领域分析的三种方法,即基于业务角色的Web信息领域分析方法、基于业务处理的Web信息领域分析方法和基于业务主题的Web信息领域分析方法。这三种方法分别从空间角度、时间角度和主题角度描述了企业在业务活动中对Web信息源的信息需求,较全面地覆盖了企业的业务活动特征。这些Web信息领域分析方法紧密联系理论和实践,具有较强的可操作性。并对WIS的管理机制进行了深入的探讨。6. 基于IBMWIR,设计开发了一个基于企业Intranet的Web信息获取原型系统WebCapture。WebCapture由客户软件和服务器软件两大部分组成。利用WebCaputre,Intranet范围内的用户可以进行Web信息获取操作。采用Softbot结构可以提高系统的灵活处理能力,另外对于系统的功能扩充也有明显的优势。从WebCaputre的运行实例可以看出,构造Intranet的Web信息获取系统可以满足特定领域群体用户的Web信息需求。
语种中文
公开日期2011-03-17
页码106
源URL[http://ir.iscas.ac.cn/handle/311060/7532]  
专题软件研究所_中科院软件所_中科院软件所
推荐引用方式
GB/T 7714
刘瑞虹. 基于Softbot的Web信息获取方法研究[D]. 中国科学院软件研究所. 中国科学院软件研究所. 1998.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。