中国科学院机构知识库网格系统: 多机器人动态编队的强化学习算法研究

多机器人动态编队的强化学习算法研究

文献类型：期刊论文


作者	王醒策 ; 张汝波 ; 顾国昌
刊名	计算机研究与发展
出版日期	2003
卷号	40 期号:10 页码:1444-1450
关键词	多机器人编队强化学习行为控制
ISSN号	1000-1239
其他题名	Research on Dynamic Team Formation of Multi-Robots Reinforcement Learning
产权排序	2
英文摘要	在人工智能领域中 ,强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注随着分布式人工智能中多智能体理论的不断发展 ,分布式强化学习算法逐渐成为研究的重点首先介绍了强化学习的研究状况 ,然后以多机器人动态编队为研究模型 ,阐述应用分布式强化学习实现多机器人行为控制的方法应用SOM神经网络对状态空间进行自主划分 ,以加快学习速度 ;应用BP神经网络实现强化学习 ,以增强系统的泛化能力 ;并且采用内、外两个强化信号兼顾机器人的个体利益及整体利益为了明确控制任务 ,系统使用黑板通信方式进行分层控制最后由仿真实验证明该方法的有效性
语种	中文
CSCD记录号	CSCD:1198684
资助机构	中国科学院沈阳自动化研究所机器人学研究室基金(RL2 0 0 10 6);;国防基础研究项目基金
公开日期	2010-11-29
源URL	[http://210.72.131.170//handle/173321/3157]
专题	沈阳自动化研究所_机器人学研究室
通讯作者	王醒策
作者单位	1.中国科学院沈阳自动化研究所机器人学重点实验室 2.哈尔滨工程大学计算机科学与技术学院
推荐引用方式 GB/T 7714	王醒策,张汝波,顾国昌. 多机器人动态编队的强化学习算法研究[J]. 计算机研究与发展,2003,40(10):1444-1450.
APA	王醒策,张汝波,&顾国昌.(2003).多机器人动态编队的强化学习算法研究.计算机研究与发展,40(10),1444-1450.
MLA	王醒策,et al."多机器人动态编队的强化学习算法研究".计算机研究与发展 40.10(2003):1444-1450.

入库方式： OAI收割

来源：沈阳自动化研究所

下载0

多机器人动态编队的强化学习算法研究

其他版本