一种新的多智能体强化学习算法及其在多机器人协作任务中的应用
文献类型:期刊论文
作者 | 仲宇; 顾国昌; 张汝波 |
刊名 | 机器人
![]() |
出版日期 | 2003 |
卷号 | 25期号:4页码:344-348,362 |
关键词 | 分布式强化学习 加速算法 多智能体系统 |
ISSN号 | 1002-0446 |
其他题名 | A NEW MULTI-AGENT REINFORCEMENT LEARNING ALGORITHM AND ITS APPLICATION TO MULTI-ROBOT COOPERATION TASKS |
产权排序 | 2 |
英文摘要 | 在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数 ,并应用于多机器人协作任务之中 .实验结果表明 ,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略 . |
语种 | 中文 |
CSCD记录号 | CSCD:1173711 |
资助机构 | 中国科学院机器人学开放研究实验室基金资助 (RL 2 0 0 10 6 );;武器装备预研基金项目及国防基础研究基金的资助 |
公开日期 | 2010-11-29 |
源URL | [http://210.72.131.170//handle/173321/3103] ![]() |
专题 | 沈阳自动化研究所_机器人学研究室 |
通讯作者 | 顾国昌 |
作者单位 | 1.中国科学院沈阳自动化研究所机器人学重点实验室 2.哈尔滨工程大学计算机科学与技术学院 |
推荐引用方式 GB/T 7714 | 仲宇,顾国昌,张汝波. 一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J]. 机器人,2003,25(4):344-348,362. |
APA | 仲宇,顾国昌,&张汝波.(2003).一种新的多智能体强化学习算法及其在多机器人协作任务中的应用.机器人,25(4),344-348,362. |
MLA | 仲宇,et al."一种新的多智能体强化学习算法及其在多机器人协作任务中的应用".机器人 25.4(2003):344-348,362. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。