中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种新的多智能体强化学习算法及其在多机器人协作任务中的应用

文献类型:期刊论文

作者仲宇; 顾国昌; 张汝波
刊名机器人
出版日期2003
卷号25期号:4页码:344-348,362
关键词分布式强化学习 加速算法 多智能体系统
ISSN号1002-0446
其他题名A NEW MULTI-AGENT REINFORCEMENT LEARNING ALGORITHM AND ITS APPLICATION TO MULTI-ROBOT COOPERATION TASKS
产权排序2
英文摘要在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数 ,并应用于多机器人协作任务之中 .实验结果表明 ,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略 .
语种中文
CSCD记录号CSCD:1173711
资助机构中国科学院机器人学开放研究实验室基金资助 (RL 2 0 0 10 6 );;武器装备预研基金项目及国防基础研究基金的资助
公开日期2010-11-29
源URL[http://210.72.131.170//handle/173321/3103]  
专题沈阳自动化研究所_机器人学研究室
通讯作者顾国昌
作者单位1.中国科学院沈阳自动化研究所机器人学重点实验室
2.哈尔滨工程大学计算机科学与技术学院
推荐引用方式
GB/T 7714
仲宇,顾国昌,张汝波. 一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J]. 机器人,2003,25(4):344-348,362.
APA 仲宇,顾国昌,&张汝波.(2003).一种新的多智能体强化学习算法及其在多机器人协作任务中的应用.机器人,25(4),344-348,362.
MLA 仲宇,et al."一种新的多智能体强化学习算法及其在多机器人协作任务中的应用".机器人 25.4(2003):344-348,362.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。