腿式运动与滑板运动的结合
Legged Locomotion Meets Skateboarding

原始链接: https://umich-curly.github.io/DHAL/

本文介绍了离散时间混合自动机学习 (DHAL) 框架,该框架使用基于策略的强化学习来识别和执行模式切换,无需轨迹分割或事件函数学习。混合动力系统包含连续流动和离散模式切换,可以模拟腿式机器人运动等机器人任务。基于模型的方法依赖于预定义的步态,而无模型方法缺乏明确的模式切换知识。目前的方法通过分割来识别离散模式,然后回归连续流动,但是学习高维复杂刚体动力学而无需轨迹标签或分割是一个具有挑战性的开放性问题。我们的方法结合了 beta 策略分布和多评论家架构来模拟接触引导运动,例如具有挑战性的四足机器人滑板任务。我们通过模拟和实际测试验证了我们的方法,证明了其在混合动力系统中的鲁棒性能。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 腿部运动与滑板运动结合 (umich-curly.github.io) 10 分,来自 jam,1 小时前 | 隐藏 | 过去 | 收藏 | 1 评论 amelius 1 分钟前 [–] 另一个AI宣称要完成有趣任务的案例。 回复 加入我们,参加6月16-17日在旧金山举办的AI创业学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

原文

This paper introduces Discrete-time Hybrid Automata Learning (DHAL), a framework using on-policy Reinforcement Learning to identify and execute mode-switching without trajectory segmentation or event function learning. Hybrid dynamical systems, which include continuous flow and discrete mode switching, can model robotics tasks like legged robot locomotion. Model-based methods depend on predefined gaits, while model-free approaches lack explicit mode-switching knowledge. Current methods identify discrete modes via segmentation before regressing continuous flow, but learning high-dimensional complex rigid body dynamics without trajectory labels or segmentation is a challenging open problem. Our approach incorporates a beta policy distribution and a multi-critic architecture to model contact-guided motions, exemplified by a challenging quadrupedal robot skateboard task. We validate our method through simulations and real-world tests, demonstrating robust performance in hybrid dynamical systems.

联系我们 contact @ memedata.com