論文の概要: RMA: Rapid Motor Adaptation for Legged Robots
- arxiv url: http://arxiv.org/abs/2107.04034v1
- Date: Thu, 8 Jul 2021 17:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 13:49:27.207297
- Title: RMA: Rapid Motor Adaptation for Legged Robots
- Title(参考訳): RMA:ラジコンロボットの高速モータ適応
- Authors: Ashish Kumar, Zipeng Fu, Deepak Pathak, Jitendra Malik
- Abstract要約: 本稿では,四足歩行ロボットにおけるリアルタイムオンライン適応の課題を解決するために,ラピッドモータ適応(RMA)アルゴリズムを提案する。
RMAは、参照軌跡や事前に定義された足跡生成器のようなドメイン知識を使わずに、完全にシミュレーションで訓練される。
我々は、生物エネルギーにインスパイアされた報酬を用いて様々な地形発生装置でRMAを訓練し、様々な困難な地形に展開する。
- 参考スコア(独自算出の注目度): 71.61319876928009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Successful real-world deployment of legged robots would require them to adapt
in real-time to unseen scenarios like changing terrains, changing payloads,
wear and tear. This paper presents Rapid Motor Adaptation (RMA) algorithm to
solve this problem of real-time online adaptation in quadruped robots. RMA
consists of two components: a base policy and an adaptation module. The
combination of these components enables the robot to adapt to novel situations
in fractions of a second. RMA is trained completely in simulation without using
any domain knowledge like reference trajectories or predefined foot trajectory
generators and is deployed on the A1 robot without any fine-tuning. We train
RMA on a varied terrain generator using bioenergetics-inspired rewards and
deploy it on a variety of difficult terrains including rocky, slippery,
deformable surfaces in environments with grass, long vegetation, concrete,
pebbles, stairs, sand, etc. RMA shows state-of-the-art performance across
diverse real-world as well as simulation experiments. Video results at
https://ashish-kmr.github.io/rma-legged-robots/
- Abstract(参考訳): 実世界のロボットの展開に成功すれば、地形の変更、ペイロードの変更、摩耗、ひび割れといった、目に見えないシナリオにリアルタイムで適応する必要がある。
本稿では,四足歩行ロボットにおけるリアルタイムオンライン適応の課題を解決するために,RMAアルゴリズムを提案する。
RMAは基本ポリシーと適応モジュールの2つのコンポーネントから構成される。
これらの部品の組み合わせにより、ロボットは1秒の分数で新しい状況に適応できる。
RMAは、参照軌跡や事前に定義された足跡発生器のようなドメイン知識を使わずに、完全にシミュレーションで訓練され、微調整なしでA1ロボットに展開される。
バイオエネルギクスに触発された報奨を用いてrmaを多種多様な地形発生器に訓練し, 草原, 長植生, コンクリート, 小石, 階段, 砂などの環境において, 岩盤, すべり, 変形可能な表面上に配置した。
RMAは、様々な現実世界にわたる最先端のパフォーマンスとシミュレーション実験を示す。
https://ashish-kmr.github.io/rma-legged-robots/
関連論文リスト
- Sim-to-Real Transfer for Mobile Robots with Reinforcement Learning: from NVIDIA Isaac Sim to Gazebo and Real ROS 2 Robots [1.2773537446441052]
この記事では、イザックの地域計画と障害物回避への応用を実証することに焦点を当てる。
ロボット・オペレーティング・システム(ROS)のナビゲーション・スタックであるNav2でエンドツーエンドのポリシーをベンチマークする。
また、Isaacシミュレータで訓練されたポリシーを実世界のロボットにゼロショット転送可能であることを示すことで、sim-to-realトランスファープロセスをカバーしている。
論文 参考訳(メタデータ) (2025-01-06T10:26:16Z) - The One RING: a Robotic Indoor Navigation Generalist [58.431772508378344]
RING (Robotic Indoor Navigation Generalist) は、インボディーズ・アグノースティックな政策である。
様々なランダムなエンボディメントを大規模に組み込んだシミュレーションでのみ訓練される。
5つのシミュレーションと4つのロボットプラットフォームで平均72.1%と78.9%の成功率を達成した。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - HomeRobot: Open-Vocabulary Mobile Manipulation [107.05702777141178]
Open-Vocabulary Mobile Manipulation (OVMM) は、目に見えない環境で任意のオブジェクトを選択し、命令された場所に配置する問題である。
HomeRobotには2つのコンポーネントがある。シミュレーションコンポーネントは、新しい高品質のマルチルームホーム環境に、大規模で多様なキュレートされたオブジェクトセットを使用する。
論文 参考訳(メタデータ) (2023-06-20T14:30:32Z) - Adapting Rapid Motor Adaptation for Bipedal Robots [73.5914982741483]
移動制御の急速な適応の最近の進歩を活用し、二足歩行ロボットで作業できるように拡張する。
A-RMAはモデルフリーRLを用いて微調整することで不完全外部推定器の基本方針を適応する。
シミュレーションにおいて,A-RMAはRLベースのベースラインコントローラやモデルベースコントローラよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-30T17:59:09Z) - MetaMorph: Learning Universal Controllers with Transformers [45.478223199658785]
ロボット工学では、主に1つのタスクのために1つのロボットを訓練します。
モジュラーロボットシステムは、汎用的なビルディングブロックをタスク最適化形態に柔軟な組み合わせを可能にする。
モジュール型ロボット設計空間上でユニバーサルコントローラを学習するためのトランスフォーマーベースのアプローチであるMetaMorphを提案する。
論文 参考訳(メタデータ) (2022-03-22T17:58:31Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - robo-gym -- An Open Source Toolkit for Distributed Deep Reinforcement
Learning on Real and Simulated Robots [0.5161531917413708]
本稿では,ロボットによる深層強化学習を向上するためのオープンソースのツールキット,robo-gymを提案する。
シミュレーションにおけるトレーニングからロボットへのシームレスな移動を可能にするシミュレーション環境と実環境の統一的なセットアップを実証する。
産業用ロボットを特徴とする2つの実世界アプリケーションを用いて,本フレームワークの能力と有効性を示す。
論文 参考訳(メタデータ) (2020-07-06T13:51:33Z) - Smooth Exploration for Robotic Reinforcement Learning [11.215352918313577]
強化学習(Reinforcement Learning, RL)は、ロボットが現実世界との対話からスキルを学ぶことを可能にする。
実際には、Deep RLで使用される非構造的なステップベースの探索は、実際のロボットにジャーキーな動きパターンをもたらす。
本稿では、状態依存探索(SDE)を現在のDeep RLアルゴリズムに適応させることにより、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-05-12T12:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。