中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
化学主题网络爬虫的设计和实现

文献类型:期刊论文

作者夏诏杰; 梁春燕; 郭力
刊名计算机工程与应用
出版日期2006
期号10页码:204-205+229
关键词主题爬虫 主题搜索引擎 化学主题网络爬虫 Widrow-Hoff分类器
英文摘要由于通用搜索引擎检索返回的结果过多、主题相关性不强以及随着人们对提供的各项信息服务的要求越来越高,基于整个Web的信息采集越来越力不从心。同时它无法及时地采集到足够的最新的Web信息,也不能满足人们日益增长的个性化需求。本文通过把Internet化学资源导航系统所积累的化学知识与搜索引擎的自动采集技术相结合展开了对化学主题网络爬虫开发的研究。结果表明,基于Widrow-Hoff分类器的化学主题网络爬虫能有效的采集化学相关的网页。
源URL[http://ir.ipe.ac.cn/handle/122111/25165]  
专题中国科学院过程工程研究所
作者单位中国科学院过程工程所多相实验室,中国科学院过程工程所多相实验室,中国科学院过程工程所多相实验室 北京100080,北京100080,北京100080
推荐引用方式
GB/T 7714
夏诏杰,梁春燕,郭力. 化学主题网络爬虫的设计和实现[J]. 计算机工程与应用,2006(10):204-205+229.
APA 夏诏杰,梁春燕,&郭力.(2006).化学主题网络爬虫的设计和实现.计算机工程与应用(10),204-205+229.
MLA 夏诏杰,et al."化学主题网络爬虫的设计和实现".计算机工程与应用 .10(2006):204-205+229.

入库方式: OAI收割

来源:过程工程研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。