中国科学院机构知识库网格系统: 基于Softbot的Web信息获取方法研究

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于Softbot的Web信息获取方法研究

文献类型：学位论文


作者	刘瑞虹
学位类别	博士
答辩日期	1998
授予单位	中国科学院软件研究所
授予地点	中国科学院软件研究所
关键词	Web信息获取多Softbot体系结构（MSA） We信息获取模式通讯原语 Web信息领域分析 Web信息主题企业Intranet V群用户
学位专业	计算机软件
中文摘要	自从1990年12月世界上第一个Web软件在Steven Job的NeXT计算机系统上诞生以来，Web技术及其应用在世界范围内以惊人的速度迅速扩展，现在其已渗透到了工作生活的各个领域。面对如此众多的Web服务器与其上面丰富的Web信息资源，如何有效快捷地进行Web信息获取变的越来越重要。特别是随着Intranet日益的广泛应用，出现了以企业员工为主体的用户群，他们在Internet上形成了以企业为单位的集体行为操作特征。而已有的Web信息获取软件工具还不能充分满足企业用户群的Web信息获取需求。为了从根本上解决此问题，必须发展针对企业Intranet 的Web信息获取机制。在Internet/Intranet环境下，进行有效的Web信息的获取是当今软件技术一个重要研究方向。本文结合所承担的国家“九五”重点科技攻关计划（96－743－01－01－05）专题“网络信息获取前后服务处理技术”和“金桥”工程项目的“Web信息获取系统”开发任务，采用Softbot（软件机器人）技术，对基于企业Intranet的Web信息获取方法进行了研究。论文的主要工作包括以下几个方面：1. 分析了现有Web信息获取系统采用的技术和服务现象。认为Web信息获取从技术上经历了分类目录方法、搜索引擎方法、元搜索引擎方法的演化过程；从服务对象上经历了个体用户向区域用户，群体用户的发展。然后从Web信息获取的技术方法和服务对象两个方面探讨了Web信息获取的新发展方向，即智能化的Web信息获取和Intranet范围的群体用户。2. 综述了Web信息特征和Web信息获取特征。在此基础上，给出了现有Web信息获取的概念模式分类和用户分类。目前存在的主要Web信息获取系统都是面向个体用户的，信息内容也趋向于一般化，由于Web信息呈指增长，因此建立一个包括全部Web信息内容的搜索引擎几乎是不可能的。为了克服这些困难，Web信息获取向分专业方向发展是一种趋势。而企业Intranet的迅速发展，使得面向Intranet的Web信息获取变的日趋重要。3. 对Softbot进行了明确的定义。对Softbot的组成、功能和基本结构进行了研究，采用BNF对Softbot结构进行了详细的定义，详细分析描述了Softbot的内部运行机制，在此基础上对多Softbot体系结构（MSA）的特点、分类和交互进行了研究，给出了用通讯原语（CP）和黑板结构进行Softbot之间的信息交流的具体方式。4. 提出了基于Intranet的Web信息获取模式和Web信息获取模型IBMWIR。基于Intranet的Web信息获取模式的核心是把企业业务活动所需要的Web信息动态收集在Intranet内的服务器上。同时给出了采用多Softbot体系结构（MSA）构造设计的基于Intranet的Web信息获取模型IBMWIR。在IBMWIR中，探讨了根据Web信息主题词集，利用记者类Softbot的派驻，驻留等手段对Web信息数据库内容进行实时更新的运行机制。5. 提出了Web信息领域分析的概念。Web信息领域分析就是得到企业的Web信息主题（WIS）的过程，其在进行企业级Web信息获取的过程中起着非常重要的作用。并给出了企业Web信息领域分析的三种方法，即基于业务角色的Web信息领域分析方法、基于业务处理的Web信息领域分析方法和基于业务主题的Web信息领域分析方法。这三种方法分别从空间角度、时间角度和主题角度描述了企业在业务活动中对Web信息源的信息需求，较全面地覆盖了企业的业务活动特征。这些Web信息领域分析方法紧密联系理论和实践，具有较强的可操作性。并对WIS的管理机制进行了深入的探讨。6. 基于IBMWIR，设计开发了一个基于企业Intranet的Web信息获取原型系统WebCapture。WebCapture由客户软件和服务器软件两大部分组成。利用WebCaputre，Intranet范围内的用户可以进行Web信息获取操作。采用Softbot结构可以提高系统的灵活处理能力，另外对于系统的功能扩充也有明显的优势。从WebCaputre的运行实例可以看出，构造Intranet的Web信息获取系统可以满足特定领域群体用户的Web信息需求。
语种	中文
公开日期	2011-03-17
页码	106
源URL	[http://ir.iscas.ac.cn/handle/311060/7532]
专题	软件研究所_中科院软件所_中科院软件所
推荐引用方式 GB/T 7714	刘瑞虹. 基于Softbot的Web信息获取方法研究[D]. 中国科学院软件研究所. 中国科学院软件研究所. 1998.

入库方式： OAI收割

来源：软件研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。