論文の概要: CPG-RL: Learning Central Pattern Generators for Quadruped Locomotion
- arxiv url: http://arxiv.org/abs/2211.00458v1
- Date: Tue, 1 Nov 2022 13:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:41:44.634167
- Title: CPG-RL: Learning Central Pattern Generators for Quadruped Locomotion
- Title(参考訳): CPG-RL:四足歩行のための中央パターン生成器の学習
- Authors: Guillaume Bellegarda, Auke Ijspeert
- Abstract要約: 本稿では, 集中型パターン生成装置(CPG)を深部強化学習フレームワークに統合し, 頑健な四足歩行を実現する手法を提案する。
シミュレーションでポリシをトレーニングし、Unitree A1の4倍体へのシミュレート・トゥ・リアル転送を行い、トレーニング中に見えない障害に対するロバストな振る舞いを観察する。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this letter, we present a method for integrating central pattern
generators (CPGs), i.e. systems of coupled oscillators, into the deep
reinforcement learning (DRL) framework to produce robust and omnidirectional
quadruped locomotion. The agent learns to directly modulate the intrinsic
oscillator setpoints (amplitude and frequency) and coordinate rhythmic behavior
among different oscillators. This approach also allows the use of DRL to
explore questions related to neuroscience, namely the role of descending
pathways, interoscillator couplings, and sensory feedback in gait generation.
We train our policies in simulation and perform a sim-to-real transfer to the
Unitree A1 quadruped, where we observe robust behavior to disturbances unseen
during training, most notably to a dynamically added 13.75 kg load representing
115% of the nominal quadruped mass. We test several different observation
spaces based on proprioceptive sensing and show that our framework is
deployable with no domain randomization and very little feedback, where along
with the oscillator states, it is possible to provide only contact booleans in
the observation space. Video results can be found at
https://youtu.be/xqXHLzLsEV4.
- Abstract(参考訳): 本稿では,結合発振器のシステムである中央パターン生成器(CPG)を深部強化学習(DRL)フレームワークに統合し,強靭で一方向の四足歩行を実現する手法を提案する。
エージェントは、固有発振器セットポイント(振幅と周波数)を直接変調し、異なる発振器間のリズム挙動を調整することを学習する。
このアプローチはまた、DRLを使用して神経科学、すなわち下降経路、振動子間結合、歩行生成における感覚フィードバックの役割に関する質問を探索することができる。
私たちは、シミュレーションでポリシーを訓練し、unitree a1 4rupedへのsim-to-real転送を行い、トレーニング中に目に見えない外乱に対する堅牢な行動を観察します。
固有感覚センシングに基づいて複数の異なる観測空間をテストし、我々のフレームワークがドメインのランダム化やフィードバックのほとんどなくデプロイ可能であり、振動子状態とともに観測空間に接触ブールのみを提供することができることを示した。
ビデオ結果はhttps://youtu.be/xqXHLzLsEV4で見ることができる。
関連論文リスト
- Learning Emergent Gaits with Decentralized Phase Oscillators: on the
role of Observations, Rewards, and Feedback [16.290816894141003]
四足歩行学習のための最小位相発振器モデルを提案する。
位相観察, 単純な位相に基づく報酬, および局所フィードバックのダイナミクスの組み合わせは, 突発的な歩行嗜好を示すポリシーを誘導することを示した。
論文 参考訳(メタデータ) (2024-02-13T18:46:10Z) - Inferring Relational Potentials in Interacting Systems [56.498417950856904]
このような相互作用を発見する代替手法として、ニューラル・インタラクション・推論(NIIP)を提案する。
NIIPは観測された関係制約を尊重する軌道のサブセットに低エネルギーを割り当てる。
別々に訓練されたモデル間での相互作用の型を交換するなどの軌道操作や、軌道予測を可能にする。
論文 参考訳(メタデータ) (2023-10-23T00:44:17Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Generating Oscillation Activity with Echo State Network to Mimic the
Behavior of a Simple Central Pattern Generator [13.021014899410684]
本稿では,改良型エコー状態ネットワーク(ESN)を用いた簡易中央パターン生成器(CPG)の再生手法を提案する。
貯水池で発振を発生させるために必要な特定のニューロンアンサンブルを定義し, 漏洩速度, スペクトル半径, トポロジー, 個体群の大きさの調整が, それらの発振を再現する確率をいかに高めるかを示す。
このアプローチは、ロボットシステムのためのバイオインスパイアされたコントローラの開発に有望なソリューションを提供する。
論文 参考訳(メタデータ) (2023-06-19T13:37:12Z) - Visual CPG-RL: Learning Central Pattern Generators for Visually-Guided
Quadruped Locomotion [4.557963624437784]
視覚的に誘導された四足歩行を学習するための枠組みを提案する。
奥深い強化学習フレームワークに、外感知覚と中央パターン生成装置を統合する。
以上の結果から, CPG, 明示的インターオシレータ結合, メモリ対応ポリシ表現はエネルギー効率に有益であることが示唆された。
論文 参考訳(メタデータ) (2022-12-29T18:14:38Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Gate-based spin readout of hole quantum dots with site-dependent
$g-$factors [101.23523361398418]
ゲート型反射率計を用いたスピンリードアウトによりシリコン中の二重量子ドットを実験的に検討した。
磁気分光法により生じる反射位相信号の特徴は,2点のサイト依存の$g-$factorに関する情報を伝達する。
論文 参考訳(メタデータ) (2022-06-27T09:07:20Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Neuromorphic adaptive spiking CPG towards bio-inspired locomotion of
legged robots [58.720142291102135]
スパイクセントラルパターンジェネレーターは、外部刺激によって駆動される異なる移動パターンを生成します。
終端ロボットプラットフォーム(あらゆる脚ロボット)の移動は、任意のセンサーを入力として地形に適応することができる。
論文 参考訳(メタデータ) (2021-01-24T12:44:38Z) - Learning to Locomote with Deep Neural-Network and CPG-based Control in a
Soft Snake Robot [19.80726424244039]
生体ヘビに触発されたソフトロボットヘビの新しい移動制御法を提案する。
提案した制御器の性能は,シミュレーションロボットと実ソフトヘビロボットの両方を用いて実験的に検証した。
論文 参考訳(メタデータ) (2020-01-13T04:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。