中国科学院机构知识库网格系统: 一种新的多智能体强化学习算法及其在多机器人协作任务中的应用

一种新的多智能体强化学习算法及其在多机器人协作任务中的应用

文献类型：期刊论文


作者	仲宇 ; 顾国昌 ; 张汝波
刊名	机器人
出版日期	2003
卷号	25 期号:4 页码:344-348，362
关键词	分布式强化学习加速算法多智能体系统
ISSN号	1002-0446
其他题名	A NEW MULTI-AGENT REINFORCEMENT LEARNING ALGORITHM AND ITS APPLICATION TO MULTI-ROBOT COOPERATION TASKS
产权排序	2
英文摘要	在多机器人系统中 ,评价一个机器人行为的好坏常常依赖于其它机器人的行为 ,此时必须采用组合动作以实现多机器人的协作 ,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢 .本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数 ,并应用于多机器人协作任务之中 .实验结果表明 ,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略 .
语种	中文
CSCD记录号	CSCD:1173711
资助机构	中国科学院机器人学开放研究实验室基金资助 (RL 2 0 0 10 6 );;武器装备预研基金项目及国防基础研究基金的资助
公开日期	2010-11-29
源URL	[http://210.72.131.170//handle/173321/3103]
专题	沈阳自动化研究所_机器人学研究室
通讯作者	顾国昌
作者单位	1.中国科学院沈阳自动化研究所机器人学重点实验室 2.哈尔滨工程大学计算机科学与技术学院
推荐引用方式 GB/T 7714	仲宇,顾国昌,张汝波. 一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J]. 机器人,2003,25(4):344-348，362.
APA	仲宇,顾国昌,&张汝波.(2003).一种新的多智能体强化学习算法及其在多机器人协作任务中的应用.机器人,25(4),344-348，362.
MLA	仲宇,et al."一种新的多智能体强化学习算法及其在多机器人协作任务中的应用".机器人 25.4(2003):344-348，362.

入库方式： OAI收割

来源：沈阳自动化研究所

下载0

一种新的多智能体强化学习算法及其在多机器人协作任务中的应用

其他版本