論文の概要: A Mechanistic Analysis of Sim-and-Real Co-Training in Generative Robot Policies
- arxiv url: http://arxiv.org/abs/2604.13645v1
- Date: Wed, 15 Apr 2026 09:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.464248
- Title: A Mechanistic Analysis of Sim-and-Real Co-Training in Generative Robot Policies
- Title(参考訳): ジェネレーティブ・ロボット・ポリシーにおけるシミュレーショナル・リアル・コラーニングの力学解析
- Authors: Yu Lei, Minghuan Liu, Abhiram Maddukuri, Zhenyu Jiang, Yuke Zhu,
- Abstract要約: コトレーニングは、限られたドメイン内の実世界データと、シミュレーションやクロス・エボディメント・ロボットデータのような豊富な代理データを組み合わせる。
実証的な成功にもかかわらず、いつ、なぜコトレーニングが効果的かを決定するメカニズムはいまだに理解されていない。
- 参考スコア(独自算出の注目度): 28.828770839369536
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Co-training, which combines limited in-domain real-world data with abundant surrogate data such as simulation or cross-embodiment robot data, is widely used for training generative robot policies. Despite its empirical success, the mechanisms that determine when and why co-training is effective remain poorly understood. We investigate the mechanism of sim-and-real co-training through theoretical analysis and empirical study, and identify two intrinsic effects governing performance. The first, \textbf{``structured representation alignment"}, reflects a balance between cross-domain representation alignment and domain discernibility, and plays a primary role in downstream performance. The second, the \textbf{``importance reweighting effect"}, arises from domain-dependent modulation of action weighting and operates at a secondary level. We validate these effects with controlled experiments on a toy model and extensive sim-and-sim and sim-and-real robot manipulation experiments. Our analysis offers a unified interpretation of recent co-training techniques and motivates a simple method that consistently improves upon prior approaches. More broadly, our aim is to examine the inner workings of co-training and to facilitate research in this direction.
- Abstract(参考訳): シミュレーションやクロスエボディメントロボットデータなどの豊富な代理データとドメイン内の限られた実世界データを組み合わせたコトレーニングは、生成ロボットポリシーのトレーニングに広く使用されている。
実証的な成功にもかかわらず、いつ、なぜコトレーニングが効果的かを決定するメカニズムはいまだに理解されていない。
本研究では,シム・アンド・リアル・コトレーニングのメカニズムを理論的解析と実証的研究を通じて検討し,性能を規定する2つの本質的な効果を同定する。
最初の 'textbf{``structured representation alignment" は、ドメイン間の表現アライメントとドメイン識別性のバランスを反映し、下流のパフォーマンスにおいて主要な役割を果たす。
2つ目の「textbf{``importance reweighting effect"」は、ドメイン依存的なアクション重み付けの変調から生じ、二次レベルで動作する。
本研究は,玩具模型の制御実験と,広範にシム・アンド・シム・アンド・リアルなロボット操作実験により,これらの効果を検証した。
我々の分析は、最近のコトレーニング技術の統一的な解釈を提供し、従来の手法を一貫して改善するシンプルな手法を動機付けている。
より広範に、コトレーニングの内部動作を調べ、この方向の研究を促進することを目的としている。
関連論文リスト
- RoboLab: A High-Fidelity Simulation Benchmark for Analysis of Task Generalist Policies [20.899640428403377]
既存のベンチマークでは、トレーニングと評価の間に大きなドメインオーバーラップが見られる。
これらの課題に対処するために設計されたシミュレーションベンチマークフレームワークであるRoboLabを紹介します。
詳細なメトリクスとスケーラブルなツールセットを提供することで、RoboLabはタスクジェネリストロボットポリシーの真の一般化能力を評価するためのスケーラブルなフレームワークを提供する。
論文 参考訳(メタデータ) (2026-04-10T19:42:21Z) - D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping [66.22412592525369]
本稿では,ガウスのSplat表現を生かした実--sim-to-realエンジンを導入し,実-sim-to-realエンジンについて述べる。
提案エンジンは, 各種物体の形状と質量値のマス識別において, 高精度かつロバストな性能を実現していることを示す。
これらの最適化された質量値は、力覚的なポリシー学習を促進し、オブジェクトの把握において優れた、高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-01T15:32:04Z) - Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training [21.855770200309674]
一般化可能な操作ポリシーを学習するための統合型sim-and-real協調学習フレームワークを提案する。
シミュレーションデータを活用することで,実世界の成功率を最大30%向上できることを示す。
論文 参考訳(メタデータ) (2025-09-23T04:32:53Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Reinforcement Learning with Human Feedback for Realistic Traffic
Simulation [53.85002640149283]
効果的なシミュレーションの鍵となる要素は、人間の知識と整合した現実的な交通モデルの導入である。
本研究では,現実主義に対する人間の嗜好のニュアンスを捉えることと,多様な交通シミュレーションモデルを統合することの2つの主な課題を明らかにする。
論文 参考訳(メタデータ) (2023-09-01T19:29:53Z) - Attention-based Adversarial Appearance Learning of Augmented Pedestrians [49.25430012369125]
本稿では,歩行者認識タスクのための現実的なデータを合成する手法を提案する。
本手法は, 対向的損失によって駆動される注意機構を用いて, ドメインの相違を学習する。
提案手法はこのような不一致に対して頑健であり,視覚的リアリズムと意味的整合性の両方を明らかにする。
論文 参考訳(メタデータ) (2021-07-06T15:27:00Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。