論文の概要: ManyQuadrupeds: Learning a Single Locomotion Policy for Diverse
Quadruped Robots
- arxiv url: http://arxiv.org/abs/2310.10486v2
- Date: Fri, 8 Mar 2024 14:10:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 23:15:31.556953
- Title: ManyQuadrupeds: Learning a Single Locomotion Policy for Diverse
Quadruped Robots
- Title(参考訳): ManyQuadrupeds: 四足歩行ロボットのための単一ロコモーションポリシーを学習する
- Authors: Milad Shafiee, Guillaume Bellegarda and Auke Ijspeert
- Abstract要約: 動物運動制御からインスピレーションを得ることにより、四足歩行ロボットの1つの移動方針を効果的に訓練できることを示す。
我々の方針は脊髄の中央パターン生成器(CPG)の表現を調節する。
我々は,A1ロボットの名目質量の125%に相当する15kgの負荷を付加しても,頑健な性能を観察する。
- 参考スコア(独自算出の注目度): 4.557963624437784
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Learning a locomotion policy for quadruped robots has traditionally been
constrained to a specific robot morphology, mass, and size. The learning
process must usually be repeated for every new robot, where hyperparameters and
reward function weights must be re-tuned to maximize performance for each new
system. Alternatively, attempting to train a single policy to accommodate
different robot sizes, while maintaining the same degrees of freedom (DoF) and
morphology, requires either complex learning frameworks, or mass, inertia, and
dimension randomization, which leads to prolonged training periods. In our
study, we show that drawing inspiration from animal motor control allows us to
effectively train a single locomotion policy capable of controlling a diverse
range of quadruped robots. The robot differences encompass: a variable number
of DoFs, (i.e. 12 or 16 joints), three distinct morphologies, a broad mass
range spanning from 2 kg to 200 kg, and nominal standing heights ranging from
18 cm to 100 cm. Our policy modulates a representation of the Central Pattern
Generator (CPG) in the spinal cord, effectively coordinating both frequencies
and amplitudes of the CPG to produce rhythmic output (Rhythm Generation), which
is then mapped to a Pattern Formation (PF) layer. Across different robots, the
only varying component is the PF layer, which adjusts the scaling parameters
for the stride height and length. Subsequently, we evaluate the sim-to-real
transfer by testing the single policy on both the Unitree Go1 and A1 robots.
Remarkably, we observe robust performance, even when adding a 15 kg load,
equivalent to 125% of the A1 robot's nominal mass.
- Abstract(参考訳): 四足歩行ロボットの移動ポリシーを学ぶことは、伝統的に特定のロボットの形態、質量、サイズに制約されてきた。
学習は通常、新しいシステム毎のパフォーマンスを最大化するためにハイパーパラメータと報酬関数重みを調整しなければならない新しいロボット毎に繰り返されなければならない。
あるいは、同じ自由度(dof)と形態を維持しながら、異なる大きさのロボットに対応するために単一のポリシーを訓練しようとすると、複雑な学習フレームワーク、あるいはマッシブ、慣性、次元ランダム化が必要となり、トレーニング期間が長くなる。
本研究では,動物運動制御からインスピレーションを得ることにより,多種多様な四足歩行ロボットを制御できる単一移動政策を効果的に訓練できることを示す。
ロボットの違いは、可変数のDoF(例:12または16関節)、3つの異なる形態、幅が2kgから200kg、名目の高さが18cmから100cmである。
本ポリシーでは, 脊髄における中枢パターン生成器(CPG)の表現を変調し, CPGの周波数と振幅を効果的に調整してリズム出力(リズム生成)を生成し, パターン形成(PF)層にマッピングする。
異なるロボット間で異なるコンポーネントは、ストライド高さと長さのスケーリングパラメータを調整するPF層のみである。
続いて,Unitree Go1ロボットとA1ロボットの両方で単一ポリシーをテストし,sim-to-realトランスファーを評価した。
驚くべきことに、a1ロボットの公称質量の125%に相当する15kgの負荷を付加しても、ロバストな性能が観察できる。
関連論文リスト
- Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal
Locomotion Control [112.66677641636299]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Human-Robot Skill Transfer with Enhanced Compliance via Dynamic Movement
Primitives [1.7901837062462316]
本研究では,動的運動プリミティブ(Dynamic Movement Primitives)フレームワークにおいて,人間の実演から動的特徴を抽出し,パラメータを自動チューニングする体系的手法を提案する。
本手法は,LfDとRLの両方に追従するロボット軌道を再現するために,人間の動的特徴を抽出するための実際のロボット装置に実装した。
論文 参考訳(メタデータ) (2023-04-12T08:48:28Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - Low-Rank Modular Reinforcement Learning via Muscle Synergy [25.120547719120765]
モジュール強化学習(RL)は、アクチュエータごとに学習ポリシーを学習することで、多関節ロボットの制御を分散化する。
ロボット制御におけるDoFの冗長性を利用したSOLAR(Synergy-Oriented LeARning)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T16:01:31Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - MetaMorph: Learning Universal Controllers with Transformers [45.478223199658785]
ロボット工学では、主に1つのタスクのために1つのロボットを訓練します。
モジュラーロボットシステムは、汎用的なビルディングブロックをタスク最適化形態に柔軟な組み合わせを可能にする。
モジュール型ロボット設計空間上でユニバーサルコントローラを学習するためのトランスフォーマーベースのアプローチであるMetaMorphを提案する。
論文 参考訳(メタデータ) (2022-03-22T17:58:31Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。