中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
多机器人动态编队的强化学习算法研究

文献类型:期刊论文

作者王醒策; 张汝波; 顾国昌
刊名计算机研究与发展
出版日期2003
卷号40期号:10页码:1444-1450
关键词多机器人 编队 强化学习 行为控制
ISSN号1000-1239
其他题名Research on Dynamic Team Formation of Multi-Robots Reinforcement Learning
产权排序2
英文摘要在人工智能领域中 ,强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注 随着分布式人工智能中多智能体理论的不断发展 ,分布式强化学习算法逐渐成为研究的重点 首先介绍了强化学习的研究状况 ,然后以多机器人动态编队为研究模型 ,阐述应用分布式强化学习实现多机器人行为控制的方法 应用SOM神经网络对状态空间进行自主划分 ,以加快学习速度 ;应用BP神经网络实现强化学习 ,以增强系统的泛化能力 ;并且采用内、外两个强化信号兼顾机器人的个体利益及整体利益 为了明确控制任务 ,系统使用黑板通信方式进行分层控制 最后由仿真实验证明该方法的有效性
语种中文
CSCD记录号CSCD:1198684
资助机构中国科学院沈阳自动化研究所机器人学研究室基金(RL2 0 0 10 6);;国防基础研究项目基金
公开日期2010-11-29
源URL[http://210.72.131.170//handle/173321/3157]  
专题沈阳自动化研究所_机器人学研究室
通讯作者王醒策
作者单位1.中国科学院沈阳自动化研究所机器人学重点实验室
2.哈尔滨工程大学计算机科学与技术学院
推荐引用方式
GB/T 7714
王醒策,张汝波,顾国昌. 多机器人动态编队的强化学习算法研究[J]. 计算机研究与发展,2003,40(10):1444-1450.
APA 王醒策,张汝波,&顾国昌.(2003).多机器人动态编队的强化学习算法研究.计算机研究与发展,40(10),1444-1450.
MLA 王醒策,et al."多机器人动态编队的强化学习算法研究".计算机研究与发展 40.10(2003):1444-1450.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。