論文の概要: See Tomorrow, Act Today: Foresight-Driven Autonomous Driving
- arxiv url: http://arxiv.org/abs/2605.07195v1
- Date: Fri, 08 May 2026 03:42:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.779935
- Title: See Tomorrow, Act Today: Foresight-Driven Autonomous Driving
- Title(参考訳): 明日、今日の行為: 監視駆動の自律運転
- Authors: Bozhou Zhang, Nan Song, Yuang Wang, Jiankang Deng, Xiatian Zhu, Li Zhang,
- Abstract要約: ForeSightは、予測された意思決定として自動運転を再設計する基礎的世界モデル中心の計画フレームワークである。
提案手法は,(1)事前学習された世界モデルを用いて,有望な未来世界を生成すること,(2)これらの未来を前提とした計画行動を行うこと,の2段階からなる。
- 参考スコア(独自算出の注目度): 87.02582063534608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current end-to-end autonomous driving planners are fundamentally reactive: they condition on historical and present observations to predict future actions. We argue that autonomous agents should instead imagine future scenes before deciding, just as human drivers mentally simulate ``what will happen next" before acting. We introduce ForeSight, a foundation world model centric planning framework that reframes autonomous driving as anticipatory decision-making. Rather than treating world models as auxiliary components, ForeSight makes future scene imagination the primary driver of action prediction. Our approach operates in two stages: (1) generating plausible future visual worlds via a pretrained world model, and (2) planning actions conditioned on these imagined futures. This paradigm shift from ``what should I do now?" to ``what will happen, and how should I respond?" enables genuinely anticipatory rather than reactive planning. By grounding decisions in anticipated contexts rather than present observations alone, ForeSight navigates dynamic, interactive scenarios more effectively. Extensive experiments on NAVSIM and nuScenes demonstrate that explicit future imagination significantly outperforms previous state-of-the-art alternatives, validating our foresight-driven approach.
- Abstract(参考訳): 現在のエンド・ツー・エンドの自動運転プランナーは基本的に反応し、将来の行動を予測するために歴史的および現在の観察を条件にしている。
我々は、自律的なエージェントが、人間のドライバーが行動する前に「次に何が起こるか」を精神的にシミュレートするのと同じように、未来のシーンを想像するべきだと論じる。我々は、前向きな意思決定として自律運転を再構成する基礎的世界モデル中心の計画フレームワークであるForeSightを紹介します。このフレームワークは、世界モデルを補助的なコンポーネントとして扱うのではなく、将来のシーンの想像をアクション予測の第一のドライバにします。我々のアプローチは、(1)事前訓練された世界モデルを介して、もっともらしい未来のビジュアルな世界を生成し、(2)これらの想像された未来で条件付けられたアクションを計画する2つの段階で動作します。このパラダイムシフトは、'何が起こるべきか、どのように反応するのか?
ForeSightは、現在の観測のみではなく、予測されたコンテキストで決定を下すことで、動的でインタラクティブなシナリオをより効果的にナビゲートする。
NAVSIM と nuScenes に関する大規模な実験により、将来の明示的な想像力は、これまでの最先端の代替よりも著しく優れており、我々のフォレスト駆動のアプローチを検証している。
関連論文リスト
- Uni-World VLA: Interleaved World Modeling and Planning for Autonomous Driving [52.04950569530877]
我々は、将来のフレーム予測と軌道計画の密接なインターリーブを行う統合視覚言語行動モデルUni-World VLAを提案する。
提案手法は,高忠実度将来のフレーム予測を行いながら,競合する閉ループ計画性能を実現する。
論文 参考訳(メタデータ) (2026-03-28T14:39:51Z) - FutureX: Enhance End-to-End Autonomous Driving via Latent Chain-of-Thought World Model [103.2513470454204]
FutureXは、エンド・ツー・エンドのプランナを強化し、将来のシーンの遅延推論と軌道修正を通じて複雑な動作計画を実行するパイプラインである。
FutureXは、より合理的な運動計画と衝突を減らすことで、効率を損なうことなく既存の方法を強化する。
論文 参考訳(メタデータ) (2025-12-12T02:12:49Z) - Future-Aware End-to-End Driving: Bidirectional Modeling of Trajectory Planning and Scene Evolution [96.25314747309811]
将来的なシーンの進化と軌道計画を共同でモデル化する,新たなエンドツーエンドフレームワークであるSeerDriveを紹介する。
本手法はまず,周辺環境の動態を予測するために,将来の鳥眼ビュー(BEV)の表現を予測する。
2つの重要な要素がこれを可能にする:(1)予測されたBEV機能を軌道プランナーに注入する将来対応計画、(2)反復的なシーンモデリングと車両計画。
論文 参考訳(メタデータ) (2025-10-13T07:41:47Z) - GenAD: Generative End-to-End Autonomous Driving [13.332272121018285]
GenADは、ジェネレーティブモデリング問題に自律運転を組み込むジェネレーティブフレームワークである。
本稿では,まず周囲のシーンをマップ対応のインスタンストークンに変換するインスタンス中心のシーントークン化手法を提案する。
次に、変動型オートエンコーダを用いて、軌道先行モデリングのための構造潜在空間における将来の軌道分布を学習する。
論文 参考訳(メタデータ) (2024-02-18T08:21:05Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - Learning to Anticipate Egocentric Actions by Imagination [60.21323541219304]
我々は,エゴセントリックなアクション予測タスクについて検討し,エゴセントリックなビデオの再生に先立って,将来のアクション秒を予測する。
本手法は, EPIC Kitchens Action Precipation Challenge の既視テストセットと未確認テストセットの両方において, 従来手法を有意に上回った。
論文 参考訳(メタデータ) (2021-01-13T08:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。