論文の概要: Learning Humanoid Locomotion with Transformers
- arxiv url: http://arxiv.org/abs/2303.03381v1
- Date: Mon, 6 Mar 2023 18:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 14:43:44.725923
- Title: Learning Humanoid Locomotion with Transformers
- Title(参考訳): トランスフォーマーによるヒューマノイド運動の学習
- Authors: Ilija Radosavovic, Tete Xiao, Bike Zhang, Trevor Darrell, Jitendra
Malik, Koushil Sreenath
- Abstract要約: 実世界のヒューマノイド移動に対する学習に基づくアプローチを提案する。
我々のコントローラは、観測と行動の歴史から将来の行動の自己回帰予測によって訓練される。
私たちの知る限りでは、これは実世界のフルサイズのヒューマノイド移動のための完全な学習ベースの手法の最初の実演である。
- 参考スコア(独自算出の注目度): 106.67773527437005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a sim-to-real learning-based approach for real-world humanoid
locomotion. Our controller is a causal Transformer trained by autoregressive
prediction of future actions from the history of observations and actions. We
hypothesize that the observation-action history contains useful information
about the world that a powerful Transformer model can use to adapt its behavior
in-context, without updating its weights. We do not use state estimation,
dynamics models, trajectory optimization, reference trajectories, or
pre-computed gait libraries. Our controller is trained with large-scale
model-free reinforcement learning on an ensemble of randomized environments in
simulation and deployed to the real world in a zero-shot fashion. We evaluate
our approach in high-fidelity simulation and successfully deploy it to the real
robot as well. To the best of our knowledge, this is the first demonstration of
a fully learning-based method for real-world full-sized humanoid locomotion.
- Abstract(参考訳): 実世界のヒューマノイド移動に対するシミュレート学習に基づくアプローチを提案する。
我々のコントローラは、観測と行動の歴史から将来の行動の自己回帰予測によって訓練された因果トランスフォーマである。
我々は、観測行動履歴には、強力なトランスフォーマーモデルが、重みを更新せずに、コンテキスト内の動作に適応できる世界に関する有用な情報が含まれていると仮定する。
状態推定、動的モデル、軌道最適化、参照軌跡、事前計算された歩行ライブラリは使用しない。
シミュレーションでは,ランダムな環境の集合体を用いた大規模モデルレス強化学習を訓練し,ゼロショット方式で現実世界に展開する。
提案手法を高忠実度シミュレーションで評価し,実ロボットへの展開に成功した。
私たちの知る限りでは、これは実世界のフルサイズのヒューマノイド移動のための完全な学習ベースの手法の最初の実演である。
関連論文リスト
- Learning Humanoid Locomotion over Challenging Terrain [84.35038297708485]
本研究では,自然と人為的な地形を横断する視覚障害者の移動に対する学習に基づくアプローチを提案する。
本モデルではまず, 時系列モデルを用いた平地軌道のデータセット上で事前学習を行い, 補強学習を用いて不均一な地形を微調整する。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
論文 参考訳(メタデータ) (2024-10-04T17:57:09Z) - Expressive Whole-Body Control for Humanoid Robots [20.132927075816742]
我々は、人間の動きをできるだけリアルに模倣するために、人間サイズのロボットで全身制御ポリシーを学習する。
シミュレーションとSim2Real転送のトレーニングにより、私たちのポリシーはヒューマノイドロボットを制御して、さまざまなスタイルで歩いたり、人と握手したり、現実世界で人間と踊ったりできる。
論文 参考訳(メタデータ) (2024-02-26T18:09:24Z) - Structured World Models from Human Videos [45.08503470821952]
私たちは、現実世界で、複雑で一般的な行動を直接学習する問題に取り組みます。
そこで本研究では,ロボットが操作スキルを効率よく学習する手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T17:59:32Z) - Affordances from Human Videos as a Versatile Representation for Robotics [31.248842798600606]
我々は、人間がどこでどのように対話するかを推定する視覚的余裕モデルを訓練する。
これらの行動割当の構造は、ロボットが多くの複雑なタスクを直接実行できるようにする。
私たちは、VRBと呼ばれる4つの現実世界環境、10以上のタスクと2つのロボットプラットフォームにおいて、私たちのアプローチの有効性を示します。
論文 参考訳(メタデータ) (2023-04-17T17:59:34Z) - Towards Modeling and Influencing the Dynamics of Human Learning [26.961274302321343]
私たちは、ロボットが持つ影響を理解し、それを活用して人々をよりよく支援し、人間のモデルが現実とより迅速に一致できるようにするための一歩を踏み出します。
我々のキーとなる考え方は、人間の学習を、新しい観察によって人間の内部モデルを進化させる非線形力学系としてモデル化することである。
次に、人間の学習力学モデルをロボット計画問題に組み込むことで、ロボットが人間の学習にどう影響するかを定式化する。
論文 参考訳(メタデータ) (2023-01-02T23:59:45Z) - DexTransfer: Real World Multi-fingered Dexterous Grasping with Minimal
Human Demonstrations [51.87067543670535]
本研究では,少数の人間によるデモンストレーションを行い,見えない物体のポーズを学習するロボット学習システムを提案する。
我々は,物体の点群を入力として捉え,物体を異なる初期ロボット状態から把握するための連続的な動作を予測する,厳密な把握ポリシーを訓練する。
我々のデータセットから学んだポリシーは、シミュレーションと現実世界の両方で見えないオブジェクトのポーズをうまく一般化することができる。
論文 参考訳(メタデータ) (2022-09-28T17:51:49Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z) - Visual Navigation Among Humans with Optimal Control as a Supervisor [72.5188978268463]
そこで本研究では,学習に基づく知覚とモデルに基づく最適制御を組み合わせることで,人間間をナビゲートする手法を提案する。
私たちのアプローチは、新しいデータ生成ツールであるHumANavによって実現されています。
学習したナビゲーションポリシーは、将来の人間の動きを明示的に予測することなく、人間に予測し、反応できることを実証する。
論文 参考訳(メタデータ) (2020-03-20T16:13:47Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。