多机器人动态编队的强化学习算法研究
文献类型:期刊论文
作者 | 王醒策; 张汝波; 顾国昌 |
刊名 | 计算机研究与发展
![]() |
出版日期 | 2003 |
卷号 | 40期号:10页码:1444-1450 |
关键词 | 多机器人 编队 强化学习 行为控制 |
ISSN号 | 1000-1239 |
其他题名 | Research on Dynamic Team Formation of Multi-Robots Reinforcement Learning |
产权排序 | 2 |
英文摘要 | 在人工智能领域中 ,强化学习理论由于其自学习性和自适应性的优点而得到了广泛关注 随着分布式人工智能中多智能体理论的不断发展 ,分布式强化学习算法逐渐成为研究的重点 首先介绍了强化学习的研究状况 ,然后以多机器人动态编队为研究模型 ,阐述应用分布式强化学习实现多机器人行为控制的方法 应用SOM神经网络对状态空间进行自主划分 ,以加快学习速度 ;应用BP神经网络实现强化学习 ,以增强系统的泛化能力 ;并且采用内、外两个强化信号兼顾机器人的个体利益及整体利益 为了明确控制任务 ,系统使用黑板通信方式进行分层控制 最后由仿真实验证明该方法的有效性 |
语种 | 中文 |
CSCD记录号 | CSCD:1198684 |
资助机构 | 中国科学院沈阳自动化研究所机器人学研究室基金(RL2 0 0 10 6);;国防基础研究项目基金 |
公开日期 | 2010-11-29 |
源URL | [http://210.72.131.170//handle/173321/3157] ![]() |
专题 | 沈阳自动化研究所_机器人学研究室 |
通讯作者 | 王醒策 |
作者单位 | 1.中国科学院沈阳自动化研究所机器人学重点实验室 2.哈尔滨工程大学计算机科学与技术学院 |
推荐引用方式 GB/T 7714 | 王醒策,张汝波,顾国昌. 多机器人动态编队的强化学习算法研究[J]. 计算机研究与发展,2003,40(10):1444-1450. |
APA | 王醒策,张汝波,&顾国昌.(2003).多机器人动态编队的强化学习算法研究.计算机研究与发展,40(10),1444-1450. |
MLA | 王醒策,et al."多机器人动态编队的强化学习算法研究".计算机研究与发展 40.10(2003):1444-1450. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。