論文の概要: Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation
- arxiv url: http://arxiv.org/abs/2603.15759v1
- Date: Mon, 16 Mar 2026 18:00:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.925306
- Title: Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation
- Title(参考訳): シミュレーション蒸留:迅速な実世界適応のためのシミュレーションにおける世界モデルの準備
- Authors: Jacob Levy, Tyler Westenbroek, Kevin Huang, Fernando Palafox, Patrick Yin, Shayegan Omidshafiei, Dong-Ki Kim, Abhishek Gupta, David Fridovich-Keil,
- Abstract要約: シミュレーション蒸留(SimDist)は、シミュレータから潜在世界モデルに構造的事前を蒸留するフレームワークである。
報酬モデルと価値モデルをシミュレーションから直接転送することで、SimDistは生の知覚から密集した計画信号を提供する。
SimDistは、データ効率、安定性、最終的なパフォーマンスにおいて、従来の方法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 46.80452332618188
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation-to-real transfer remains a central challenge in robotics, as mismatches between simulated and real-world dynamics often lead to failures. While reinforcement learning offers a principled mechanism for adaptation, existing sim-to-real finetuning methods struggle with exploration and long-horizon credit assignment in the low-data regimes typical of real-world robotics. We introduce Simulation Distillation (SimDist), a sim-to-real framework that distills structural priors from a simulator into a latent world model and enables rapid real-world adaptation via online planning and supervised dynamics finetuning. By transferring reward and value models directly from simulation, SimDist provides dense planning signals from raw perception without requiring value learning during deployment. As a result, real-world adaptation reduces to short-horizon system identification, avoiding long-horizon credit assignment and enabling fast, stable improvement. Across precise manipulation and quadruped locomotion tasks, SimDist substantially outperforms prior methods in data efficiency, stability, and final performance. Project website and code: https://sim-dist.github.io/
- Abstract(参考訳): シミュレーションから現実への移動はロボット工学における中心的な課題であり、シミュレーションと実世界のダイナミクスのミスマッチがしばしば失敗につながる。
強化学習は適応のための原則的なメカニズムを提供するが、既存のsim-to-realファインタニング手法は、現実世界のロボット工学に典型的なローデータ体制における探索と長期の信用割り当てに苦慮している。
シミュレーション蒸留(SimDist)は,シミュレータから潜在世界モデルへの構造的先行を蒸留し,オンライン計画と教師付きダイナミクスファインタニングによる迅速な実世界の適応を可能にする,シミュレート・トゥ・リアルなフレームワークである。
SimDistは、報酬モデルと価値モデルをシミュレーションから直接転送することで、デプロイメント中に価値学習を必要とせずに、生の認識から密集した計画信号を提供する。
結果として、現実世界の適応は、短期水平システム識別に還元され、長期水平クレジットの割り当てを回避し、高速で安定した改善を可能にする。
SimDistは正確な操作と4倍のロコモーションタスク全体にわたって、データ効率、安定性、最終的なパフォーマンスにおいて、従来の方法よりも大幅に優れています。
プロジェクトウェブサイトとコード:https://sim-dist.github.io/
関連論文リスト
- D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping [66.22412592525369]
本稿では,ガウスのSplat表現を生かした実--sim-to-realエンジンを導入し,実-sim-to-realエンジンについて述べる。
提案エンジンは, 各種物体の形状と質量値のマス識別において, 高精度かつロバストな性能を実現していることを示す。
これらの最適化された質量値は、力覚的なポリシー学習を促進し、オブジェクトの把握において優れた、高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-01T15:32:04Z) - Context-aware Learned Mesh-based Simulation via Trajectory-Level Meta-Learning [20.72669976554826]
Learned Graph Network Simulators (GNS)は、従来のメッシュベースの物理シミュレータに代わる有望な代替手段を提供する。
その速度と固有の微分性は、ロボット操作や製造最適化のような高速で正確なシミュレーションを必要とするアプリケーションに適している。
動作プリミティブを用いて、1つのモデルコールから高速で安定で正確なシミュレーションを直接予測する。
論文 参考訳(メタデータ) (2025-11-07T13:34:02Z) - Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.94013806312391]
そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文 参考訳(メタデータ) (2024-10-27T07:13:38Z) - Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [22.077058792635313]
被覆経路計画は、制限された地域の自由空間全体をカバーする経路を見つける問題である。
本稿では,この課題に対する連続空間強化学習の有効性について検討する。
提案手法は従来のRLに基づく手法と高度に専門化された手法の両方の性能を上回ることを示す。
論文 参考訳(メタデータ) (2024-06-07T13:24:19Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。