中国科学院机构知识库网格系统: 自主机器人的强化学习研究进展

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

自主机器人的强化学习研究进展

文献类型：期刊论文


作者	顾冬雷 ; 陈卫东 ; 席裕庚
刊名	机器人
出版日期	2001
卷号	23 期号:4 页码:379-384
关键词	强化学习自主机器人人工智能鲁棒性
ISSN号	1002-0446
产权排序	2
英文摘要	虽然基于行为控制自主机器人具有较高的鲁棒性，但其对于动态环境缺乏必要的自适应能力，强化学习方法使机器人可以通过学习来完成任务，而无需设计者完全预先规定机器人的所有动作，它是将动态规划和监督学习结合的基础上发展起来的一种新颖的学习方法，它通过机器人与环境的试错交互，利用来自成功和失败经验的奖励和惩罚信号不断改进机器人的性能，从而达到目标，并容许滞后评价，由于其解决复杂问题的突出能力，强化学习已成为一种非常有前途的机器人学习方法，本文系统论述了强化学习方法在自主机器人中的研究现状，指出了存在的问题，分析了几种问题解决途径，展望了未来发展趋势。
语种	中文
CSCD记录号	CSCD:663962
资助机构	国家自然科学基金重点项目 ( 698895 0 1 );; 863计划项目 ( 863- 5 1 2 - 935 5 - 0 2 )
公开日期	2010-11-29
源URL	[http://210.72.131.170//handle/173321/3343]
专题	沈阳自动化研究所_机器人学研究室
作者单位	1.中国科学院机器人学开放研究实验室　 2.上海交通大学自动化系
推荐引用方式 GB/T 7714	顾冬雷,陈卫东,席裕庚. 自主机器人的强化学习研究进展[J]. 机器人,2001,23(4):379-384.
APA	顾冬雷,陈卫东,&席裕庚.(2001).自主机器人的强化学习研究进展.机器人,23(4),379-384.
MLA	顾冬雷,et al."自主机器人的强化学习研究进展".机器人 23.4(2001):379-384.

入库方式： OAI收割

来源：沈阳自动化研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。