論文の概要: Towards Embodiment Scaling Laws in Robot Locomotion
- arxiv url: http://arxiv.org/abs/2505.05753v1
- Date: Fri, 09 May 2025 03:25:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.139945
- Title: Towards Embodiment Scaling Laws in Robot Locomotion
- Title(参考訳): ロボット移動における身体のスケーリング法則に向けて
- Authors: Bo Ai, Liu Dai, Nico Bohlinger, Dichen Li, Tongzhou Mu, Zhanxin Wu, K. Fay, Henrik I. Christensen, Jan Peters, Hao Su,
- Abstract要約: 複数の実施形態における人工処理法則のスケーリングについて検討する。
エンボディメントの数を増やすことで、目に見えないものへの一般化が向上することがわかった。
その結果,適応制御の可能性を秘めた汎用ロボット工学への道のりがうかがえる。
- 参考スコア(独自算出の注目度): 36.86431442666063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing generalist agents that can operate across diverse tasks, environments, and physical embodiments is a grand challenge in robotics and artificial intelligence. In this work, we focus on the axis of embodiment and investigate embodiment scaling laws$\unicode{x2013}$the hypothesis that increasing the number of training embodiments improves generalization to unseen ones. Using robot locomotion as a test bed, we procedurally generate a dataset of $\sim$1,000 varied embodiments, spanning humanoids, quadrupeds, and hexapods, and train generalist policies capable of handling diverse observation and action spaces on random subsets. We find that increasing the number of training embodiments improves generalization to unseen ones, and scaling embodiments is more effective in enabling embodiment-level generalization than scaling data on small, fixed sets of embodiments. Notably, our best policy, trained on the full dataset, zero-shot transfers to novel embodiments in the real world, such as Unitree Go2 and H1. These results represent a step toward general embodied intelligence, with potential relevance to adaptive control for configurable robots, co-design of morphology and control, and beyond.
- Abstract(参考訳): 多様なタスク、環境、身体の具体化をまたいで操作できる汎用エージェントを開発することは、ロボティクスと人工知能において大きな課題である。
本研究では, エンボディメントの軸に着目し, エンボディメントのスケーリング法則を考察する。$\unicode{x2013}$ トレーニングエボディメントの数を増やすことで, 一般化が未確認なものに改善されるという仮説である。
ロボットのロコモーションをテストベッドとして使用し,人型,四足歩行,六足歩行などの多種多様な実施形態のデータセットを手続き的に生成し,ランダムなサブセット上で多様な観察・行動空間を処理できる一般政策を訓練する。
トレーニング実施数の増加は、目に見えないものへの一般化を促進し、スケール実施は、小さな、固定された実施形態のデータをスケーリングするよりも、実施レベルの一般化を可能にするのに有効である。
特に、私たちのベストポリシーは、完全なデータセットに基づいてトレーニングされ、Unitree Go2やH1といった、現実世界の新しい実施形態へのゼロショット転送です。
これらの結果は、構成可能なロボットの適応制御、形態学と制御の共同設計など、一般的なインボディードインテリジェンスへの一歩である。
関連論文リスト
- AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems [88.05152114775498]
AgiBot Worldは、217のタスクにまたがる100万以上のトラジェクトリを5つのデプロイメントシナリオで構成した大規模なプラットフォームである。
AgiBot Worldは高品質で多様なデータ配信を保証する。
GO-1は、現実世界のデクスタラスタスクや長距離タスクにおいて例外的な能力を示す。
論文 参考訳(メタデータ) (2025-03-09T15:40:29Z) - DexterityGen: Foundation Controller for Unprecedented Dexterity [67.15251368211361]
ツール使用など,ロボットの巧妙な操作スキルを教えることは,大きな課題となる。
現在のアプローチは、人間の遠隔操作(模倣学習)とシミュレート・トゥ・リアル強化学習(sim-to-real reinforcement learning)の2つの戦略に大別できる。
本稿では,手動回転や翻訳などの大規模動きプリミティブをRLで事前学習するDexterityGenを紹介する。
現実の世界では、人間の遠隔操作をコントローラーのプロンプトとして利用し、厳密な振る舞いを生み出す。
論文 参考訳(メタデータ) (2025-02-06T18:49:35Z) - Universal Actions for Enhanced Embodied Foundation Models [25.755178700280933]
我々はUniversal Action Spaceで動作する新しい基礎モデリングフレームワークUniActを紹介する。
我々の学習した普遍行動は、共有された構造的特徴を利用して、多様なロボット間での一般的な原子の挙動を捉えます。
0.5BでのUniActのインスタンス化は、様々な実世界およびシミュレーションロボットの広範囲な評価において、14倍のSOTAを具現化した基礎モデルより優れている。
論文 参考訳(メタデータ) (2025-01-17T10:45:22Z) - Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration [9.42179962375058]
本稿では,デジタル人間モデルを共通プロトタイプとして使用することにより,データのボトルネックを低減するための転送可能なフレームワークを提案する。
このモデルは、人間による実演から、敵対的な模倣を通して行動プリミティブを学習し、複雑なロボット構造を機能的な構成要素に分解する。
本フレームワークは,多種多様な構成のヒューマノイドロボット5体を用いて検証した。
論文 参考訳(メタデータ) (2024-12-19T18:41:45Z) - Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers [41.069074375686164]
本稿では、政策ニューラルネットワークのトランクを事前訓練してタスクを学習し、共有表現を具体化する異種事前学習トランスフォーマー(HPT)を提案する。
52データセットの範囲で,トレーニング対象のスケーリング行動を調べる実験を行った。
HPTはいくつかのベースラインを上回り、未確認タスクで20%以上の微調整されたポリシー性能を向上させる。
論文 参考訳(メタデータ) (2024-09-30T17:39:41Z) - Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation [49.03165169369552]
さまざまな種類のロボットにまたがって単一のポリシーを訓練することによって、ロボット学習はより広範囲で多様なデータセットを活用することができる。
そこで我々はCrossFormerを提案する。CrossFormerはスケーラブルでフレキシブルなトランスフォーマーベースのポリシーで、どんな実施形態からでもデータを消費できる。
我々は、同じネットワークウェイトがシングルアームとデュアルアームの操作システム、車輪付きロボット、クワッドコプター、四足歩行など、非常に異なるロボットを制御できることを実証した。
論文 参考訳(メタデータ) (2024-08-21T17:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。