論文の概要: SPACE: Enabling Learning from Cross-Robot Data Toward Generalist Policies
- arxiv url: http://arxiv.org/abs/2606.24049v1
- Date: Tue, 23 Jun 2026 01:32:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.728049
- Title: SPACE: Enabling Learning from Cross-Robot Data Toward Generalist Policies
- Title(参考訳): SPACE: 汎用ポリシに向けたクロスロボットデータからの学習の実現
- Authors: Haeone Lee, Byeongguk Jeon, Suchae Jeong, Jian Kim, Kimin Lee,
- Abstract要約: 状態予測および適応コマンド実行(SPACE)フレームワークを紹介する。
SPACEは、異なる実施形態、同じ実施形態のハードウェアユニット、操作中の1つのロボット内での3段階のロボットダイナミクスの変動を処理します。
実験により、SPACEは異なる実施形態および同じ実施形態のハードウェアユニット間で収集されたデータから学習する際に、制御コマンドを直接予測するポリシーを大幅に上回っていることが示された。
- 参考スコア(独自算出の注目度): 20.583080585659513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robot learning, scaling training datasets across diverse embodiments and environments has become a dominant paradigm for learning generalizable robot policies. These policies are commonly trained via behavior cloning to imitate actions from pre-collected demonstrations. However, since robot actions are tied to the dynamics of the data collection robot, different robots may require different actions to achieve the same motion. This discrepancy hinders both policy training and deployment across diverse robots. To address this, we propose using Cartesian state delta as a universal action representation across robots, and introduce State Prediction and Adaptive Command Execution (SPACE) framework. SPACE handles robot dynamics variation at three levels: across different embodiments, across hardware units of the same embodiment, and within a single robot during operation. It consists of two components: (i) a Cartesian state delta policy that predicts geometric end-effector displacement, and (ii) Action Adapter, which converts the predicted Cartesian state delta into robot-specific control commands. Experiments show that SPACE substantially outperforms policies that directly predict control commands when learning from data collected across different embodiments and across hardware units of the same embodiment. SPACE also remains robust under dynamics shifts at deployment, including changes in control frequency, object weight, and controller gains. The project page is available at http://haeone.site/space-website/.
- Abstract(参考訳): ロボット学習において、多様な実施形態や環境にまたがるトレーニングデータセットのスケーリングは、一般化可能なロボットポリシーを学ぶための主要なパラダイムとなっている。
これらのポリシーは、事前に収集されたデモからアクションを模倣するために、行動クローニングを通じて一般的に訓練される。
しかし、ロボットの動作はデータ収集ロボットのダイナミックスと結びついているので、異なるロボットは同じ動作を達成するために異なる動作を必要とする可能性がある。
この不一致は、さまざまなロボットにまたがるポリシートレーニングとデプロイメントの両方を妨げる。
そこで本研究では,ロボット間のユニバーサルアクション表現としてCartesian State deltaを用い,状態予測と適応コマンド実行(SPACE)フレームワークを提案する。
SPACEは、異なる実施形態、同じ実施形態のハードウェアユニット、操作中の1つのロボット内での3段階のロボットダイナミクスの変動を処理します。
2つの構成要素から構成される。
一 幾何的端効果体変位を予測するカルテシアン状態デルタ政策及び
(ii) 予測されたカルト状態デルタをロボット固有の制御コマンドに変換するアクションアダプタ。
実験により、SPACEは異なる実施形態および同じ実施形態のハードウェアユニット間で収集されたデータから学習する際に、制御コマンドを直接予測するポリシーを大幅に上回っていることが示された。
SPACEは、制御周波数、オブジェクトの重み付け、コントローラゲインの変更など、デプロイメント時の動的シフトの下でも堅牢である。
プロジェクトのページはhttp://haeone.site/space-website/.comで公開されている。
関連論文リスト
- TAM: Torque Adaptation Module for Robust Motion Transfer in Manipulation [32.68351241308298]
接触に富んだダイナミックな操作では、小さな動きのずれでさえ参照動作の追跡に失敗することがある。
本稿では,学習モジュールであるTorque Adaptation Module (TAM)を紹介した。
論文 参考訳(メタデータ) (2026-06-04T14:31:54Z) - Learning a Unified Latent Space for Cross-Embodiment Robot Control [8.76482934005711]
本稿では,人体横断型ロボット制御のためのスケーラブルなフレームワークを提案する。
我々は、人間と多様なヒューマノイドプラットフォームをまたいだ動きを統一する、共通の潜在表現を学ぶ。
本手法は,ロボットの潜伏空間への効率的な付加を支援する。
論文 参考訳(メタデータ) (2026-01-21T19:31:17Z) - The One RING: a Robotic Indoor Navigation Generalist [58.30694487843546]
RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - Autoregressive Action Sequence Learning for Robotic Manipulation [32.9580007141312]
既存の自己回帰型アーキテクチャは、言語モデリングにおいて単語トークンとして順次、エンドエフェクタ・ウェイポイントを生成する。
我々は、因果変換器の単一トークン予測を拡張し、単一のステップで可変数のトークンを予測する。
本稿では,ハイブリッドなアクションシーケンスを生成することで操作タスクを解消するAutoregressive Policyアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-04T04:07:15Z) - Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation [49.03165169369552]
さまざまな種類のロボットにまたがって単一のポリシーを訓練することによって、ロボット学習はより広範囲で多様なデータセットを活用することができる。
そこで我々はCrossFormerを提案する。CrossFormerはスケーラブルでフレキシブルなトランスフォーマーベースのポリシーで、どんな実施形態からでもデータを消費できる。
我々は、同じネットワークウェイトがシングルアームとデュアルアームの操作システム、車輪付きロボット、クワッドコプター、四足歩行など、非常に異なるロボットを制御できることを実証した。
論文 参考訳(メタデータ) (2024-08-21T17:57:51Z) - Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment [24.93621734941354]
本稿では,形態の異なるロボットマニピュレータ間の制御ポリシの伝達に着目した。
主要な洞察は、ソースとターゲットロボットの状態と行動空間を共通の潜在空間表現に投影することである。
我々は、異なる状態、行動、実施形態のソースとターゲットロボットによるシム・トゥ・シム・トゥ・シム・トゥ・シム・トゥ・リアルな操作ポリシーの伝達を実証する。
論文 参考訳(メタデータ) (2024-06-04T05:00:24Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。