論文の概要: Continuous Versatile Jumping Using Learned Action Residuals
- arxiv url: http://arxiv.org/abs/2304.08663v1
- Date: Mon, 17 Apr 2023 23:28:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 16:11:37.938463
- Title: Continuous Versatile Jumping Using Learned Action Residuals
- Title(参考訳): 学習した動作残差を用いた連続多用途ジャンプ
- Authors: Yuxiang Yang, Xiangyun Meng, Wenhao Yu, Tingnan Zhang, Jie Tan, Byron
Boots
- Abstract要約: 本研究では,四足歩行ロボットの連続的な跳躍動作を学習するために,最適制御と強化学習を組み合わせた階層的枠組みを提案する。
我々のフレームワークの中核はスタンスコントローラであり、手動で設計した加速度コントローラと学習された残留ポリシーを組み合わせる。
シミュレーションのトレーニングの後、我々のフレームワークは実際のロボットに直接展開でき、多目的で連続的なジャンプ動作を行うことができる。
- 参考スコア(独自算出の注目度): 35.996425893483796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Jumping is essential for legged robots to traverse through difficult
terrains. In this work, we propose a hierarchical framework that combines
optimal control and reinforcement learning to learn continuous jumping motions
for quadrupedal robots. The core of our framework is a stance controller, which
combines a manually designed acceleration controller with a learned residual
policy. As the acceleration controller warm starts policy for efficient
training, the trained policy overcomes the limitation of the acceleration
controller and improves the jumping stability. In addition, a low-level
whole-body controller converts the body pose command from the stance controller
to motor commands. After training in simulation, our framework can be deployed
directly to the real robot, and perform versatile, continuous jumping motions,
including omni-directional jumps at up to 50cm high, 60cm forward, and
jump-turning at up to 90 degrees. Please visit our website for more results:
https://sites.google.com/view/learning-to-jump.
- Abstract(参考訳): 脚のあるロボットが困難な地形を横切るためには跳躍が不可欠だ。
本研究では,四足歩行ロボットの連続跳躍動作を学習するために,最適制御と強化学習を組み合わせた階層的枠組みを提案する。
我々のフレームワークの中核はスタンスコントローラであり、手動で設計した加速度コントローラと学習された残留ポリシーを組み合わせる。
加速制御装置は、効率的な訓練を行うためのポリシーを温め始めるので、訓練されたポリシーは加速度制御装置の制限を克服し、ジャンプ安定性を向上させる。
さらに、低レベル全体制御器は、姿勢制御器からの身体ポーズ指令をモータ指令に変換する。
シミュレーションでトレーニングした後、フレームワークを実際のロボットに直接配置し、全方位を最大50cm、前方60cm、最大90度のジャンプターンを含む、万能で連続的なジャンプ動作を行うことができます。
詳細はWebサイト(https://sites.google.com/view/learning-to-jump.com)を参照してほしい。
関連論文リスト
- Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Agile and versatile bipedal robot tracking control through reinforcement learning [12.831810518025309]
本稿では,二足歩行ロボットのための多目的コントローラを提案する。
足首と身体の軌跡を、単一の小さなニューラルネットワークを用いて広範囲の歩行で追跡する。
最小限の制御ユニットと高レベルなポリシーを組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
論文 参考訳(メタデータ) (2024-04-12T05:25:03Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Fast and Efficient Locomotion via Learned Gait Transitions [35.86279693549959]
四足歩行ロボットのための効率的な制御器の開発に焦点をあてる。
特徴ある移動経路と自然な歩行遷移が自動的に現れる階層的学習フレームワークを考案する。
学習した階層型コントローラは,ベースラインコントローラよりも広い移動速度でエネルギーを消費することがわかった。
論文 参考訳(メタデータ) (2021-04-09T23:53:28Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。