論文の概要: MetaMorph: Learning Universal Controllers with Transformers
- arxiv url: http://arxiv.org/abs/2203.11931v1
- Date: Tue, 22 Mar 2022 17:58:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 16:04:36.349920
- Title: MetaMorph: Learning Universal Controllers with Transformers
- Title(参考訳): MetaMorph: トランスフォーマーによるユニバーサルコントローラの学習
- Authors: Agrim Gupta, Linxi Fan, Surya Ganguli, Li Fei-Fei
- Abstract要約: ロボット工学では、主に1つのタスクのために1つのロボットを訓練します。
モジュラーロボットシステムは、汎用的なビルディングブロックをタスク最適化形態に柔軟な組み合わせを可能にする。
モジュール型ロボット設計空間上でユニバーサルコントローラを学習するためのトランスフォーマーベースのアプローチであるMetaMorphを提案する。
- 参考スコア(独自算出の注目度): 45.478223199658785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiple domains like vision, natural language, and audio are witnessing
tremendous progress by leveraging Transformers for large scale pre-training
followed by task specific fine tuning. In contrast, in robotics we primarily
train a single robot for a single task. However, modular robot systems now
allow for the flexible combination of general-purpose building blocks into task
optimized morphologies. However, given the exponentially large number of
possible robot morphologies, training a controller for each new design is
impractical. In this work, we propose MetaMorph, a Transformer based approach
to learn a universal controller over a modular robot design space. MetaMorph is
based on the insight that robot morphology is just another modality on which we
can condition the output of a Transformer. Through extensive experiments we
demonstrate that large scale pre-training on a variety of robot morphologies
results in policies with combinatorial generalization capabilities, including
zero shot generalization to unseen robot morphologies. We further demonstrate
that our pre-trained policy can be used for sample-efficient transfer to
completely new robot morphologies and tasks.
- Abstract(参考訳): 視覚、自然言語、オーディオといった複数のドメインは、大規模な事前トレーニングにTransformerを活用し、タスク固有の微調整を施すことによって、非常に進歩している。
対照的に、ロボット工学では、1つのタスクのために1つのロボットを訓練します。
しかし、モジュール型ロボットシステムでは、汎用的なビルディングブロックをタスク最適化形態に柔軟に組み合わせることができる。
しかし、指数関数的に多くの可能なロボット形態を考えると、新しい設計ごとにコントローラーを訓練するのは現実的ではない。
本研究では,モジュール型ロボット設計空間上でユニバーサルコントローラを学習するためのトランスフォーマーベースアプローチであるMetaMorphを提案する。
MetaMorphは、ロボット形態学はトランスフォーマーの出力を条件付けできる別のモダリティである、という洞察に基づいている。
様々なロボット形態の大規模事前学習により、ゼロショットの一般化から見えないロボット形態への一般化を含む組合せ一般化能力を持つポリシーが導かれることを示す。
さらに,新たなロボット形態やタスクへのサンプル効率の高い移行に,事前学習したポリシを活用できることを実証する。
関連論文リスト
- One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [18.556470359899855]
統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2024-09-10T09:44:15Z) - Body Transformer: Leveraging Robot Embodiment for Policy Learning [51.531793239586165]
ボディートランスフォーマー(ボディートランスフォーマー、Body Transformer、BoT)は、学習プロセスを導く誘導バイアスを提供することで、ロボットの体現性を活用するアーキテクチャである。
我々はロボットの体をセンサーとアクチュエータのグラフとして表現し、建築全体を通してプール情報にマスキングされた注意を頼りにしている。
結果として得られるアーキテクチャは、バニラ変換器と古典的な多層パーセプトロンを、タスク完了、スケーリング特性、計算効率の点で上回る。
論文 参考訳(メタデータ) (2024-08-12T17:31:28Z) - RoboMorph: Evolving Robot Morphology using Large Language Models [0.5812095716568273]
本稿では,モジュール型ロボットの設計を自動生成・最適化するRoboMorphを紹介する。
自動プロンプト設計と強化学習に基づく制御アルゴリズムを統合することで、RoboMorphはフィードバックループを通じてロボット設計を反復的に改善する。
論文 参考訳(メタデータ) (2024-07-11T16:05:56Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - DittoGym: Learning to Control Soft Shape-Shifting Robots [30.287452037945542]
我々は、その生涯で形態を変えることができるロボットとして定義された、再構成可能な新しいロボットを探索する。
再構成可能なソフトロボットの制御を高次元強化学習(RL)問題として定式化する。
細かな形態変化を必要とするソフトロボットのための総合的なRLベンチマークであるDittoGymを紹介する。
論文 参考訳(メタデータ) (2024-01-24T05:03:05Z) - RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation [33.10577695383743]
ロボット操作のためのマルチタスク汎用エージェントRoboCatを提案する。
このデータは、シミュレートされた本物のロボットアームから、さまざまな観察とアクションのセットでモーターコントロールスキルの大規模なレパートリーにまたがる。
RoboCatでは、ゼロショットだけでなく、100-1000例のみを用いて適応することで、新しいタスクやロボットに一般化する能力を実証する。
論文 参考訳(メタデータ) (2023-06-20T17:35:20Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。