論文の概要: Visual CPG-RL: Learning Central Pattern Generators for Visually-Guided
Quadruped Navigation
- arxiv url: http://arxiv.org/abs/2212.14400v1
- Date: Thu, 29 Dec 2022 18:14:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 16:13:49.463408
- Title: Visual CPG-RL: Learning Central Pattern Generators for Visually-Guided
Quadruped Navigation
- Title(参考訳): visual cpg-rl: 視覚誘導四足ナビゲーションのための学習中心パターン生成器
- Authors: Guillaume Bellegarda, Auke Ijspeert
- Abstract要約: 本稿では,集中型パターン生成器(CPG)を深層強化学習(DRL)フレームワークに統合することにより,四重化ナビゲーションを学習するためのフレームワークを提案する。
メモリ対応ポリシ表現と明示的インターオシレータ結合の両方が,ナビゲーションタスクにおけるsim-to-real転送の成功に有用であることを示す。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a framework for learning quadruped navigation by
integrating central pattern generators (CPGs), i.e. systems of coupled
oscillators, into the deep reinforcement learning (DRL) framework. Through both
exteroceptive and proprioceptive sensing, the agent learns to modulate the
intrinsic oscillator setpoints (amplitude and frequency) and coordinate
rhythmic behavior among different oscillators to track velocity commands while
avoiding collisions with the environment. We compare different neural network
architectures (i.e. memory-free and memory-enabled) which learn implicit
interoscillator couplings, as well as varying the strength of the explicit
coupling weights in the oscillator dynamics equations. We train our policies in
simulation and perform a sim-to-real transfer to the Unitree Go1 quadruped,
where we observe robust navigation in a variety of scenarios. Our results show
that both memory-enabled policy representations and explicit interoscillator
couplings are beneficial for a successful sim-to-real transfer for navigation
tasks. Video results can be found at https://youtu.be/O_LX1oLZOe0.
- Abstract(参考訳): 本稿では,集中型パターン生成器(CPG),すなわち結合振動子の系を深層強化学習(DRL)フレームワークに統合することにより,四重化ナビゲーションを学習するためのフレームワークを提案する。
内在性発振器セットポイント(振幅と周波数)を調節し、異なる発振器間のリズム挙動を調整し、環境との衝突を避けながら速度指令を追跡する。
我々は、暗黙の相互振動子結合を学習する異なるニューラルネットワークアーキテクチャ(メモリフリーとメモリ対応)を比較し、振動子力学方程式における明示的な結合重みの強さを変化させる。
私たちは、シミュレーションでポリシーをトレーニングし、unitree go1 quadrupedにsim-to-real転送を行い、さまざまなシナリオで堅牢なナビゲーションを観察します。
その結果、メモリ対応のポリシー表現と明示的なoscillator結合は、ナビゲーションタスクのsim-to-real転送の成功に有用であることが示された。
ビデオの結果はhttps://youtu.be/o_lx1olzoe0で見ることができる。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - CPG-RL: Learning Central Pattern Generators for Quadruped Locomotion [4.56877715768796]
本稿では, 集中型パターン生成装置(CPG)を深部強化学習フレームワークに統合し, 頑健な四足歩行を実現する手法を提案する。
シミュレーションでポリシをトレーニングし、Unitree A1の4倍体へのシミュレート・トゥ・リアル転送を行い、トレーニング中に見えない障害に対するロバストな振る舞いを観察する。
論文 参考訳(メタデータ) (2022-11-01T13:41:13Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in
Dynamic Environments [25.366480092589022]
四足歩行ロボットは、環境の乱雑さや移動する障害物に応答して、頑丈で機敏な歩行行動を示す必要がある。
本稿では,知覚的移動の問題をハイレベルな意思決定に分解する,PreLUDEという階層型学習フレームワークを提案する。
シミュレーションおよびハードウェア実験において,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-09-19T17:55:07Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - DriveGAN: Towards a Controllable High-Quality Neural Simulation [147.6822288981004]
DriveGANと呼ばれる新しい高品質のニューラルシミュレータを紹介します。
DriveGANは、異なるコンポーネントを監督なしで切り離すことによって制御性を達成する。
実世界の運転データ160時間を含む複数のデータセットでdriveganをトレーニングします。
論文 参考訳(メタデータ) (2021-04-30T15:30:05Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - CARL: Controllable Agent with Reinforcement Learning for Quadruped
Locomotion [0.0]
CARLは、高レベルの指示で制御でき、動的環境に自然に反応できる4重結合剤である。
我々は、ジェネレーティブ・アドリラル・ネットワークを使用して、速度や方向などのハイレベルな制御を、オリジナルのアニメーションに対応するアクション・ディストリビューションに適応させる。
深部強化学習によるさらなる微調整により、エージェントは、スムーズな遷移を発生させながら、目に見えない外部摂動から回復することができる。
論文 参考訳(メタデータ) (2020-05-07T07:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。