中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种高效的分布式爬虫系统负载均衡策略

文献类型:期刊论文

作者张树涛1,2; 谭海波2; 陈良锋2; 吕波2
刊名计算机工程
出版日期2019-01-23
关键词分布式爬虫 负载均衡 预测模型 粒子群优化算法 约束条件
英文摘要

传统分布式爬虫系统负载均衡方法仅考虑少量的负载影响因素,未对各爬虫节点负载情况进行全面有效的评估,使得任务量的分配不合理。针对该问题,提出一种面向分布式爬虫系统的高效负载均衡策略。分析影响爬虫节点运行时间的因素,采用BP神经网络构建基于多影响因素的非线性分布式爬虫节点运行时间模型。以该模型预测的各子节点运行时间的最小方差为负载均衡策略的目标函数,并利用带约束条件的改进粒子群优化算法求解目标函数,确定负载均衡的任务分配方案。实验结果表明,该负载均衡策略在满足爬虫节点高性能要求的前提下,能有效缩短分布式爬虫系统的运行时间。

语种中文
源URL[http://ir.hfcas.ac.cn:8080/handle/334002/43175]  
专题合肥物质科学研究院_信息中心
作者单位1.中国科学技术大学
2.中国科学院合肥物质科学研究院
推荐引用方式
GB/T 7714
张树涛,谭海波,陈良锋,等. 一种高效的分布式爬虫系统负载均衡策略[J]. 计算机工程,2019.
APA 张树涛,谭海波,陈良锋,&吕波.(2019).一种高效的分布式爬虫系统负载均衡策略.计算机工程.
MLA 张树涛,et al."一种高效的分布式爬虫系统负载均衡策略".计算机工程 (2019).

入库方式: OAI收割

来源:合肥物质科学研究院

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。