論文の概要: Decoupling Scene Perception and Ego Status: A Multi-Context Fusion Approach for Enhanced Generalization in End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2511.13079v1
- Date: Mon, 17 Nov 2025 07:27:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.899631
- Title: Decoupling Scene Perception and Ego Status: A Multi-Context Fusion Approach for Enhanced Generalization in End-to-End Autonomous Driving
- Title(参考訳): シーン認識とエゴステータスのデカップリング: エンドツーエンド自動運転における一般化のためのマルチコンテキスト融合アプローチ
- Authors: Jiacheng Tang, Mingyue Feng, Jiachao Liu, Yaonong Wang, Jian Pu,
- Abstract要約: マルチコンテキスト融合戦略に基づくアーキテクチャレベルのソリューションであるAdaptiveADを提案する。
1つのブランチはマルチタスク学習に基づくシーン駆動推論を行うが、エゴ状態は意図的にBEVエンコーダから省略される。
次に、シーン認識融合モジュールは、2つのブランチからの補完的な決定を適応的に統合し、最終的な計画軌道を形成する。
- 参考スコア(独自算出の注目度): 15.479184019515168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modular design of planning-oriented autonomous driving has markedly advanced end-to-end systems. However, existing architectures remain constrained by an over-reliance on ego status, hindering generalization and robust scene understanding. We identify the root cause as an inherent design within these architectures that allows ego status to be easily leveraged as a shortcut. Specifically, the premature fusion of ego status in the upstream BEV encoder allows an information flow from this strong prior to dominate the downstream planning module. To address this challenge, we propose AdaptiveAD, an architectural-level solution based on a multi-context fusion strategy. Its core is a dual-branch structure that explicitly decouples scene perception and ego status. One branch performs scene-driven reasoning based on multi-task learning, but with ego status deliberately omitted from the BEV encoder, while the other conducts ego-driven reasoning based solely on the planning task. A scene-aware fusion module then adaptively integrates the complementary decisions from the two branches to form the final planning trajectory. To ensure this decoupling does not compromise multi-task learning, we introduce a path attention mechanism for ego-BEV interaction and add two targeted auxiliary tasks: BEV unidirectional distillation and autoregressive online mapping. Extensive evaluations on the nuScenes dataset demonstrate that AdaptiveAD achieves state-of-the-art open-loop planning performance. Crucially, it significantly mitigates the over-reliance on ego status and exhibits impressive generalization capabilities across diverse scenarios.
- Abstract(参考訳): 計画指向自動運転のモジュール設計は、エンド・ツー・エンドのシステムを著しく進歩させた。
しかしながら、既存のアーキテクチャは、エゴのステータスへの過度な依存によって制約され、一般化と堅牢なシーン理解を妨げる。
我々は、根本原因をこれらのアーキテクチャに固有の設計として認識し、エゴのステータスをショートカットとして簡単に活用できるようにします。
具体的には、上流BEVエンコーダにおけるエゴ状態の早期融合により、下流計画モジュールを支配下に置く前に、この強みからの情報フローが可能である。
この課題に対処するために,マルチコンテキスト融合戦略に基づくアーキテクチャレベルのソリューションであるAdaptiveADを提案する。
その中核はデュアルブランチ構造であり、シーン認識とエゴステータスを明示的に分離している。
一方のブランチはマルチタスク学習に基づくシーン駆動推論を行うが、エゴ状態は意図的にBEVエンコーダから省略され、他方のブランチは計画タスクのみに基づいてエゴ駆動推論を行う。
次に、シーン認識融合モジュールは、2つのブランチからの補完的な決定を適応的に統合し、最終的な計画軌道を形成する。
このデカップリングがマルチタスク学習を損なわないようにするため、ego-BEVインタラクションのためのパスアテンション機構を導入し、BEVの一方向蒸留と自己回帰オンラインマッピングという2つの目的の補助的タスクを追加する。
nuScenesデータセットの大規模な評価は、AdaptiveADが最先端のオープンループ計画パフォーマンスを達成することを示している。
重要なのは、Egoのステータスの過度な信頼性を著しく軽減し、さまざまなシナリオにまたがる素晴らしい一般化能力を示すことだ。
関連論文リスト
- DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Planning-oriented Autonomous Driving [60.93767791255728]
我々は、最終目標、すなわち自動運転車の計画を追求するために、好ましいフレームワークを考案し、最適化すべきであると主張している。
フルスタック運転タスクをひとつのネットワークに組み込んだ総合的なフレームワークであるUnified Autonomous Driving (UniAD)を紹介した。
論文 参考訳(メタデータ) (2022-12-20T10:47:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。