論文の概要: Robust High-speed Running for Quadruped Robots via Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2103.06484v1
- Date: Thu, 11 Mar 2021 06:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 21:54:30.351516
- Title: Robust High-speed Running for Quadruped Robots via Deep Reinforcement
Learning
- Title(参考訳): 深部強化学習による四足歩行ロボットのロバスト高速走行
- Authors: Guillaume Bellegarda and Quan Nguyen
- Abstract要約: そこで,本稿では,環境障害にともなうできるだけ速く走行するタスクのために,カルタゴ空間における足場位置の学習について検討する。
他のアクション空間と比較して、より少ない報酬形成、より優れたサンプル効率、ギャロッピングやバウンディングなどの自然歩行の出現を観察する。
公称4倍の質量の100%以上の負荷で荒れた地形の上を走るという困難なタスクであっても、政策はわずか数百万の時間ステップで学ぶことができます。
- 参考スコア(独自算出の注目度): 7.264355680723856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep reinforcement learning has emerged as a popular and powerful way to
develop locomotion controllers for quadruped robots. Common approaches have
largely focused on learning actions directly in joint space, or learning to
modify and offset foot positions produced by trajectory generators. Both
approaches typically require careful reward shaping and training for millions
of time steps, and with trajectory generators introduce human bias into the
resulting control policies. In this paper, we instead explore learning foot
positions in Cartesian space, which we track with impedance control, for a task
of running as fast as possible subject to environmental disturbances. Compared
with other action spaces, we observe less needed reward shaping, much improved
sample efficiency, the emergence of natural gaits such as galloping and
bounding, and ease of sim-to-sim transfer. Policies can be learned in only a
few million time steps, even for challenging tasks of running over rough
terrain with loads of over 100% of the nominal quadruped mass. Training occurs
in PyBullet, and we perform a sim-to-sim transfer to Gazebo, where our
quadruped is able to run at over 4 m/s without a load, and 3.5 m/s with a 10 kg
load, which is over 83% of the nominal quadruped mass. Video results can be
found at https://youtu.be/roE1vxpEWfw.
- Abstract(参考訳): 深層強化学習は、四足歩行ロボットのためのロコモーションコントローラを開発するための人気で強力な方法として登場した。
一般的なアプローチは、関節空間で直接的に行動を学ぶことや、軌道発生器が生み出す足の位置の変更とオフセットを学習することに集中してきた。
どちらのアプローチも、通常、数百万のタイムステップで慎重に報酬形成とトレーニングを行う必要があり、軌道発生器は、結果として生じる制御ポリシーに人間のバイアスをもたらします。
そこで本論文では,環境障害にともなう可能な限り速く走行するタスクのために,インピーダンス制御により追跡するカルテジアン空間における足の位置の学習について検討する。
他のアクション空間と比較して、より少ない報酬形成、より優れたサンプル効率、ギャロッピングやバウンディングなどの自然歩行の出現、シム-ト-シム移動の容易さが観察できる。
公称4倍の質量の100%以上の負荷で荒れた地形の上を走るという困難なタスクであっても、政策はわずか数百万の時間ステップで学ぶことができます。
トレーニングはPyBulletで行われ、私たちのクアッドループは負荷なしで4 m/s以上、そして名目クアッドループ質量の83%以上である10 kg負荷で3.5 m/sで走ることができるガゼボへのシムツーシム転送を実行します。
ビデオの結果はhttps://youtu.be/roe1vxpewfwで見ることができる。
関連論文リスト
- Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - A Walk in the Park: Learning to Walk in 20 Minutes With Model-Free
Reinforcement Learning [86.06110576808824]
深層強化学習は、制御されていない環境での学習ポリシーに対する有望なアプローチである。
機械学習アルゴリズムとライブラリの最近の進歩と、慎重に調整されたロボットコントローラを組み合わせることで、現実世界では4分で学習できる。
論文 参考訳(メタデータ) (2022-08-16T17:37:36Z) - Learning to Walk in Minutes Using Massively Parallel Deep Reinforcement
Learning [2.930703970709558]
我々は,1台のワークステーションGPU上で大規模並列処理を用いることで,実世界のロボットタスクの高速なポリシー生成を実現するトレーニングセットを提示し,研究する。
我々は,大規模並列システムにおける異なるトレーニングアルゴリズムコンポーネントが最終ポリシー性能とトレーニング時間に与える影響を分析し,議論する。
本稿では,何千ものシミュレーションロボットを並列に学習するのに適した,ゲームに触発された新しいカリキュラムを提案する。
論文 参考訳(メタデータ) (2021-09-24T14:04:19Z) - Learning Quadruped Locomotion Policies using Logical Rules [2.008081703108095]
四足歩行ロボットの歩行仕様と効率的なポリシー学習を実現することを目的としている。
我々の手法はRM-based Locomotion Learning (RMLL)と呼ばれ、実行時の歩行周波数の調整をサポートする。
実際の四足歩行ロボットを用いて,これらの学習方針を実証する。
論文 参考訳(メタデータ) (2021-07-23T00:37:32Z) - Quadruped Locomotion on Non-Rigid Terrain using Reinforcement Learning [10.729374293332281]
非剛性な動的地形上での移動学習のための新しい強化学習フレームワークを提案する。
55cmのトレーニングを受けたロボットは、最大5cmまで沈むことができる地形を歩ける。
様々な地形条件でロボットを訓練することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-07-07T00:34:23Z) - Fast and Efficient Locomotion via Learned Gait Transitions [35.86279693549959]
四足歩行ロボットのための効率的な制御器の開発に焦点をあてる。
特徴ある移動経路と自然な歩行遷移が自動的に現れる階層的学習フレームワークを考案する。
学習した階層型コントローラは,ベースラインコントローラよりも広い移動速度でエネルギーを消費することがわかった。
論文 参考訳(メタデータ) (2021-04-09T23:53:28Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。