中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
自主机器人的强化学习研究进展

文献类型:期刊论文

作者顾冬雷; 陈卫东; 席裕庚
刊名机器人
出版日期2001
卷号23期号:4页码:379-384
关键词强化学习 自主机器人 人工智能 鲁棒性
ISSN号1002-0446
产权排序2
英文摘要虽然基于行为控制自主机器人具有较高的鲁棒性,但其对于动态环境缺乏必要的自适应能力,强化学习方法使机器人可以通过学习来完成任务,而无需设计者完全预先规定机器人的所有动作,它是将动态规划和监督学习结合的基础上发展起来的一种新颖的学习方法,它通过机器人与环境的试错交互,利用来自成功和失败经验的奖励和惩罚信号不断改进机器人的性能,从而达到目标,并容许滞后评价,由于其解决复杂问题的突出能力,强化学习已成为一种非常有前途的机器人学习方法,本文系统论述了强化学习方法在自主机器人中的研究现状,指出了存在的问题,分析了几种问题解决途径,展望了未来发展趋势。
语种中文
CSCD记录号CSCD:663962
资助机构国家自然科学基金重点项目 ( 698895 0 1 );; 863计划项目 ( 863- 5 1 2 - 935 5 - 0 2 )
公开日期2010-11-29
源URL[http://210.72.131.170//handle/173321/3343]  
专题沈阳自动化研究所_机器人学研究室
作者单位1.中国科学院机器人学开放研究实验室 
2.上海交通大学自动化系
推荐引用方式
GB/T 7714
顾冬雷,陈卫东,席裕庚. 自主机器人的强化学习研究进展[J]. 机器人,2001,23(4):379-384.
APA 顾冬雷,陈卫东,&席裕庚.(2001).自主机器人的强化学习研究进展.机器人,23(4),379-384.
MLA 顾冬雷,et al."自主机器人的强化学习研究进展".机器人 23.4(2001):379-384.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。