基于Softbot的Web信息获取方法研究
文献类型:学位论文
作者 | 刘瑞虹 |
学位类别 | 博士 |
答辩日期 | 1998 |
授予单位 | 中国科学院软件研究所 |
授予地点 | 中国科学院软件研究所 |
关键词 | Web信息获取 多Softbot体系结构(MSA) We信息获取模式 通讯原语 Web信息领域分析 Web信息主题 企业Intranet V群用户 |
学位专业 | 计算机软件 |
中文摘要 | 自从1990年12月世界上第一个Web软件在Steven Job的NeXT计算机系统上诞生以来,Web技术及其应用在世界范围内以惊人的速度迅速扩展,现在其已渗透到了工作生活的各个领域。面对如此众多的Web服务器与其上面丰富的Web信息资源,如何有效快捷地进行Web信息获取变的越来越重要。特别是随着Intranet日益的广泛应用,出现了以企业员工为主体的用户群,他们在Internet上形成了以企业为单位的集体行为操作特征。而已有的Web信息获取软件工具还不能充分满足企业用户群的Web信息获取需求。为了从根本上解决此问题,必须发展针对企业Intranet 的Web信息获取机制。在Internet/Intranet环境下,进行有效的Web信息的获取是当今软件技术一个重要研究方向。本文结合所承担的国家“九五”重点科技攻关计划(96-743-01-01-05)专题“网络信息获取前后服务处理技术”和“金桥”工程项目的“Web信息获取系统”开发任务,采用Softbot(软件机器人)技术,对基于企业Intranet的Web信息获取方法进行了研究。论文的主要工作包括以下几个方面:1. 分析了现有Web信息获取系统采用的技术和服务现象。认为Web信息获取从技术上经历了分类目录方法、搜索引擎方法、元搜索引擎方法的演化过程;从服务对象上经历了个体用户向区域用户,群体用户的发展。然后从Web信息获取的技术方法和服务对象两个方面探讨了Web信息获取的新发展方向,即智能化的Web信息获取和Intranet范围的群体用户。2. 综述了Web信息特征和Web信息获取特征。在此基础上,给出了现有Web信息获取的概念模式分类和用户分类。目前存在的主要Web信息获取系统都是面向个体用户的,信息内容也趋向于一般化,由于Web信息呈指增长,因此建立一个包括全部Web信息内容的搜索引擎几乎是不可能的。为了克服这些困难,Web信息获取向分专业方向发展是一种趋势。而企业Intranet的迅速发展,使得面向Intranet的Web信息获取变的日趋重要。3. 对Softbot进行了明确的定义。对Softbot的组成、功能和基本结构进行了研究,采用BNF对Softbot结构进行了详细的定义,详细分析描述了Softbot的内部运行机制,在此基础上对多Softbot体系结构(MSA)的特点、分类和交互进行了研究,给出了用通讯原语(CP)和黑板结构进行Softbot之间的信息交流的具体方式。4. 提出了基于Intranet的Web信息获取模式和Web信息获取模型IBMWIR。基于Intranet的Web信息获取模式的核心是把企业业务活动所需要的Web信息动态收集在Intranet内的服务器上。同时给出了采用多Softbot体系结构(MSA)构造设计的基于Intranet的Web信息获取模型IBMWIR。在IBMWIR中,探讨了根据Web信息主题词集,利用记者类Softbot的派驻,驻留等手段对Web信息数据库内容进行实时更新的运行机制。5. 提出了Web信息领域分析的概念。Web信息领域分析就是得到企业的Web信息主题(WIS)的过程,其在进行企业级Web信息获取的过程中起着非常重要的作用。并给出了企业Web信息领域分析的三种方法,即基于业务角色的Web信息领域分析方法、基于业务处理的Web信息领域分析方法和基于业务主题的Web信息领域分析方法。这三种方法分别从空间角度、时间角度和主题角度描述了企业在业务活动中对Web信息源的信息需求,较全面地覆盖了企业的业务活动特征。这些Web信息领域分析方法紧密联系理论和实践,具有较强的可操作性。并对WIS的管理机制进行了深入的探讨。6. 基于IBMWIR,设计开发了一个基于企业Intranet的Web信息获取原型系统WebCapture。WebCapture由客户软件和服务器软件两大部分组成。利用WebCaputre,Intranet范围内的用户可以进行Web信息获取操作。采用Softbot结构可以提高系统的灵活处理能力,另外对于系统的功能扩充也有明显的优势。从WebCaputre的运行实例可以看出,构造Intranet的Web信息获取系统可以满足特定领域群体用户的Web信息需求。 |
语种 | 中文 |
公开日期 | 2011-03-17 |
页码 | 106 |
源URL | [http://ir.iscas.ac.cn/handle/311060/7532] ![]() |
专题 | 软件研究所_中科院软件所_中科院软件所 |
推荐引用方式 GB/T 7714 | 刘瑞虹. 基于Softbot的Web信息获取方法研究[D]. 中国科学院软件研究所. 中国科学院软件研究所. 1998. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。