中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于学习方法的机器人轴孔装配问题研究

文献类型:学位论文

作者刘乃龙1,2
答辩日期2020-05-22
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师王志东 ; 崔龙
关键词机器人装配 力控制 示教学习 深度强化学习 接触状态
学位名称博士
学位专业机械电子工程
其他题名Research on the Robotic Peg-in-Hole Assembly based on Machine Learning
英文摘要装配操作广泛存在于工业制造和生产过程中。由于机器人灵巧操作能力的限制,至今仍有大量的装配任务无法被机器人所取代。传统的机器人的操控方法往往需要精确的本体模型和环境模型,而在装配操作中机器人与环境接触的动力学难以被精确建模,特别是与环境之间的摩擦力模型。在接触任务中存在着诸多不确定性,导致传统的方法在解决机器人装配问题中具有很大的局限性。随着机器学习方法的快速发展,特别是它模式识别领域,尤其是计算机视觉领域有了快速的发展,而被认为是一种非常有前途的方法。机器学习方法不需要准确指定系统模型,而是通过数据驱动方法来建模。虽然机器学习方法在模式识别领域有了很大的发展,但是与机器人操作控制的结合还存在诸多限制。本文试图通过机器学习技术,与机器人传统的操控技术相结合,以提高机器人的操作能力,来使得机器人能够学习复杂的装配操作技巧,而无需建立精确的环境接触模型。 传统的机器人任务往往依赖大量的手动编程和硬编码的方法,难以适应这种快速的产品线变更。针对传统方法的这种局限性,我们提出在 3D 图形仿真环境下基于深度强化学习的自学习方法来训练机器人学习轴孔装配任务,利用深度神经网络来编码机器人控制策略,通过 PPO 深度强化学习方法来训练该深度神经网络,以泛化机器人的操作策略,使得机器人能处理更多环境不确定性因素下的轴孔装配问题。在基于 ROS 和 Gazebo 搭建的仿真平台上,进行仿真实验,证明我们提出的方法的有效性。 示教学习方法被认为是解决机器人进行复杂操作任务的一种很有前途的方法,但是以传统的示教学习方法是为了学习位置轨迹,并没有考虑环境的接触力,为此我们基于传统的笛卡尔空间 DMPs 轨迹生成模型提出了一种改进的笛卡尔空间 DMPs 模型,使其生成的轨迹更接近于人类操作者的运动行为。同时为了学习运动过程中的接触行为,我们在模型中引入了接触力和位置的反馈机制,使得模型模型不仅可以编码位置轨迹信息,同时也能编码接触行为中的力信息。同时,在执行轨迹的装配过程中,我们使用了基于阻抗控制的柔顺控制器,以保证安全柔顺的操作行为。并通过仿真实验验证了轨迹生成模型的收敛性,并在真实硬件上说明了改进后的这种带有力位混合反馈机制的模型在插孔过程中的动态性能有了一定的提升。 进行接触状态的辨识和分析,有助于进一步设计更有针对性的控制系统,同时也有助于对状态过程的装配事件进行监控。传统的接触状态辨识的方法往往都是通过监督数据的方式对装配过程中所产生的接触信号特征和接触状态之间建立映射关系,从而对接触状态进行分类。这种方法的局限性就是依赖于这种监督数据的获取,另外其往往都依赖于准静态接触模型。为了进一步发现更多隐藏的接触类型,我们直接从原生的接触信号出发,利用无监督和多变量时间序列的聚类方式,从接触数据中获取更多的接触类型。通过利用 DTC 网络构建端到端的接触状态聚类模型,来对装配过程中的状态进行辨识。 大部分的机器学习方法需要大量的数据来进行长时间的训练,而在真实环境中,这种成本是很高的,为此,我们搭建了数据更容易产生和获取的 3D 仿真环境。并针对示教学习方法,利用 KUKA 机器人搭建了学习平台。最后基于该平台进行仿真的实验研究,以表明本文相关研究方法的有效性。
语种中文
产权排序1
页码110页
源URL[http://ir.sia.cn/handle/173321/27164]  
专题沈阳自动化研究所_机器人学研究室
作者单位1.中国科学院沈阳自动化研究所;
2.中国科学院大学
推荐引用方式
GB/T 7714
刘乃龙. 基于学习方法的机器人轴孔装配问题研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2020.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。