基于强化学习的机器人操作策略表征与学习
文献类型:学位论文
作者 | 杨依明![]() |
答辩日期 | 2024-05-19 |
文献子类 | 博士 |
关键词 | 强化学习 机器人操作 机器人控制 策略表征 |
英文摘要 | 近年来强化学习在机器人领域的研究与应用受到了广泛的关注。与模仿学习等其它机器人策略学习方法不同,强化学习允许机器人智能体通过与环境的自主交互来学习和优化策略,不需要明确的监督信号即可从过往经验中不断调整和改进自身的行为决策。这种学习模式使得机器人能够在非结构化环境中持续获得性能提升,在复杂多变的环境下更好更快地完成任务。而机器人操作策略的表征与学习作为机器人从感知智能迈向认知智能的关键一环,更是天然契合强化学习自主能动的闭环学习特性。 然而现有基于强化学习的机器人操作策略研究往往没有与机器人任务本身的独特性相结合。机器人操作脱胎于人类操作,机器人本体和操作任务本身往往具备鲜明的仿生特性,相应的任务大多也能被人类所执行。因此如果在设计机器人操作策略时能借鉴人脑在执行操作任务时对观测到的时空耦合信息的处理能力、多脑区协同机制以及完成操作任务时脑神经对人手的控制方法,就能使机器人操作策略具备更为合理的归纳偏置,事半功倍。鉴于此,本论文采取强化学习为主要方法,充分借鉴人类执行操作任务时的认知行为机制,深刻考虑机器人任务的固有属性,致力于在多样化的任务环境中探究与完善机器人的策略表征和学习算法,以期提高机器人操作策略的整体性能。
|
学科主题 | 控制理论 |
语种 | 中文 |
页码 | 126 |
源URL | [http://ir.ia.ac.cn/handle/173211/56638] ![]() |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 杨依明. 基于强化学习的机器人操作策略表征与学习[D]. 2024. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。