論文の概要: Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation
- arxiv url: http://arxiv.org/abs/2606.05015v1
- Date: Wed, 03 Jun 2026 15:38:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.863478
- Title: Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation
- Title(参考訳): 視覚に基づくクアドロレータナビゲーションのための環境変動下における世界モデルの一般化
- Authors: Luca Zanatta, Grzegorz Malczyk, Kostas Alexis,
- Abstract要約: 世界モデルは、環境がどのように進化するかを予測する学習された生成モデルであり、サンプル効率のよいロボット学習のための有望なツールとなっている。
本研究では,視覚に基づく四角形ナビゲーションをテストベッド問題とし,環境ランダム性の異なるDreamerV3ベースの世界モデルを訓練する。
そして、すべての世界モデルと関連するナビゲーションポリシーを、すべてのセンサーが切断される前に実際の感覚入力を2.5秒だけ受信するオープンループランなど、目に見えない環境で実際の四角形に展開します。
以上の結果から,SSL事前トレーニング中の世界モデルロバスト性はsim-to-realの強い予測因子であることが示された。
- 参考スコア(独自算出の注目度): 10.364779390403337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: World models, learned generative models that predict how an environment evolves, have become a promising tool for sample-efficient robot learning. Yet how robust they are to environmental variability remains poorly understood. To address this, we conduct a systematic study using vision-based quadrotor navigation as a testbed problem, training DreamerV3-based world models under varying levels of environmental randomness and evaluating them across all levels through cross-environment validation, spanning both Self-Supervised Learning (SSL) pretraining and Reinforcement Learning (RL) fine-tuning. We then deploy all world models and associated navigation policies on a real quadrotor in unseen environments, including an open-loop run where the model receives just 2.5s of real sensory input before all sensors are cut off, leaving the system to navigate entirely in imagination over a 12m traverse. Our results show that world model robustness during SSL pretraining is a strong predictor of sim-to-real transfer: every model that generalized well in cross-environment SSL validation deployed successfully in the real world, passing through gaps as narrow as 0.67m, whereas the model that dominated simulation policy evaluation failed on the real platform. We further identify (a) the discrete latent size and (b) the training-sequence length as the dominant factors governing world model quality.
- Abstract(参考訳): 世界モデルは、環境がどのように進化するかを予測する学習された生成モデルであり、サンプル効率のよいロボット学習のための有望なツールとなっている。
しかし、環境変動にどれほど頑丈かはいまだに理解されていない。
そこで我々は,視覚に基づく四角形ナビゲーションをテストベッド問題として用い,環境ランダム性の異なるレベルにおけるドリーマーV3ベースの世界モデルを訓練し,自己教師付き学習(SSL)と強化学習(RL)の両方にまたがる環境間検証を通じて,すべてのレベルにわたって評価する。
そして、すべての世界モデルと関連するナビゲーションポリシーを、見知らぬ環境で実際の四角形にデプロイします。例えば、すべてのセンサーが切断される前に、モデルが実際の感覚入力を2.5秒だけ受信するオープンループランニングなどです。
その結果、SSLプリトレーニング中の世界モデルの堅牢性は、sim-to-real転送の強力な予測要因であることが判明した: クロス環境のSSLバリデーションにおいてよく一般化されたモデルはすべて、0.67mという狭いギャップを通り抜け、実際のプラットフォームではシミュレーションポリシー評価を支配したモデルが失敗した。
我々はさらに特定する
a) 個別の潜伏サイズと潜伏サイズ
b)世界モデル品質を規定する主要な要因はトレーニングシーケンスの長さである。
関連論文リスト
- Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond [209.35045331678043]
2つの軸に沿って組織された「レベルx法」の分類を導入します。
第一に、3つの能力レベルを定義している: 1段階の局所遷移演算子を学ぶL1 Predictor、それらをドメインの法則を尊重する多段階のアクション条件付きロールアウトに構成するL2 Simulator、新しいエビデンスに対して予測が失敗すると自己のモデルを自動で修正するL3 Evolver。
我々は400以上の作品を合成し、モデルに基づく強化学習、ビデオ生成、WebおよびGUIエージェント、マルチエージェント社会シミュレーション、AIによる科学的発見にまたがる100以上の代表システムを要約する。
論文 参考訳(メタデータ) (2026-04-24T17:48:47Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - Trajectory World Models for Heterogeneous Environments [67.27233466954814]
環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
また,様々なセンサやアクチュエータ情報を扱える新しいアーキテクチャであるTrajWorldを提案する。
論文 参考訳(メタデータ) (2025-02-03T13:59:08Z) - WHALE: Towards Generalizable and Scalable World Models for Embodied Decision-making [40.53824201182517]
本稿では、一般化可能な世界モデルを学ぶためのフレームワークであるWHALEを紹介する。
Whale-STは、拡張一般化性を備えた時空間変圧器を用いたスケーラブルな世界モデルである。
また、Open X-Embodimentデータセットから970K軌道上でトレーニングされた414MパラメータワールドモデルであるWhale-Xを提案する。
論文 参考訳(メタデータ) (2024-11-08T15:01:27Z) - One-shot World Models Using a Transformer Trained on a Synthetic Prior [37.027893127637036]
ワンショット世界モデル(英: One-Shot World Model、OSWM)は、純粋に合成データからコンテキスト内学習形式で学習されるトランスフォーマー世界モデルである。
OSWMは、シンプルなグリッド世界のダイナミクスや、CartPoleのジム、カスタムコントロール環境に迅速に適応できる。
論文 参考訳(メタデータ) (2024-09-21T09:39:32Z) - Predictive World Models from Real-World Partial Observations [66.80340484148931]
本研究では,現実の道路環境に対する確率論的予測世界モデル学習のためのフレームワークを提案する。
従来の手法では、学習のための基礎的真理として完全状態を必要とするが、HVAEが部分的に観察された状態のみから完全状態を予測することを学べる新しい逐次訓練法を提案する。
論文 参考訳(メタデータ) (2023-01-12T02:07:26Z) - Quantifying Multimodality in World Models [5.593667856320704]
RLに基づく世界モデルにおけるマルチモーダル不確実性の検出と定量化のための新しい指標を提案する。
不確実な将来の状態の正しいモデリングと検出は、安全な方法で重要な状況を扱うための基盤となる。
論文 参考訳(メタデータ) (2021-12-14T09:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。