論文の概要: CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving
- arxiv url: http://arxiv.org/abs/2606.06219v1
- Date: Thu, 04 Jun 2026 14:32:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.855632
- Title: CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving
- Title(参考訳): CLEAR: エンドツーエンド自動運転における適応ルーティングの認識と潜時評価
- Authors: Yining Xing, Zehong Ke, Zhiyuan Liu, Yanbo Jiang, Wenhao Yu, Jianqiang Wang,
- Abstract要約: 超高速な生成計画と深い意味的推論を組み合わせたフレームワークであるCLEARを提案する。
CLEARはDrive-JEPAをビジュアルエンコーダとして採用し、VAEラテント空間におけるマルチステップデノイングチェーンを単一ステップ条件ドリフトに置き換える。
NAVSIM v1ベンチマークでは、CLEARは93.7の最先端のPDMSを達成した。
- 参考スコア(独自算出の注目度): 19.474428775260034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end autonomous driving models often struggle to balance multi-modal maneuver generation with real-time inference constraints. While diffusion models successfully capture diverse driving behaviors, their iterative denoising process incurs unacceptable latency for safety-critical deployment. To address this, we propose CLEAR (Cognition and Latent Evaluation for Adaptive Routing), a framework that combines ultra-fast generative planning with deep semantic reasoning. CLEAR employs Drive-JEPA as the visual encoder and replaces the multi-step denoising chain with a single-step conditional drift in a VAE latent space, introducing a conditioning coefficient to balance diversity and expert precision. Meanwhile, we fully fine-tune Qwen~3.5~0.8B on driving QA pairs to extract scene-aware hidden states. These states guide both an Adaptive Scheduler, which selects the conditioning coefficient $α$ and sample count $N$ from a discrete set of predefined schemes, and a cross-attention scorer that selects the optimal trajectory from candidates. On the NAVSIM v1 benchmark, CLEAR achieves a state-of-the-art PDMS of 93.7. Our results demonstrate that high-fidelity, multi-modal planning can be executed efficiently without dense geometric annotations or iterative sampling.
- Abstract(参考訳): エンドツーエンドの自動運転モデルは、マルチモーダルな操作生成とリアルタイムの推論制約のバランスをとるのに苦労することが多い。
拡散モデルは様々な運転行動を捉えるのに成功しているが、その反復的認知過程は、安全クリティカルなデプロイメントにおいて許容できないレイテンシを引き起こす。
そこで我々は,超高速な生成計画と深い意味的推論を組み合わせたフレームワークであるCLEAR(Cognition and Latent Evaluation for Adaptive Routing)を提案する。
CLEARはDrive-JEPAをビジュアルエンコーダとして採用し、VAEラテント空間における1ステップの条件付きドリフトに置き換え、多様性と専門家の精度のバランスをとる条件付き係数を導入している。
一方,QAペアを駆動するQwen~3.5~0.8Bを完全に微調整し,シーン認識型隠れ状態の抽出を行う。
これらの状態は、個別に定義されたスキームの集合から条件係数$α$とサンプルカウント$N$を選択するAdaptive Schedulerと、候補から最適軌跡を選択するクロスアテンションスコアラの両方をガイドする。
NAVSIM v1ベンチマークでは、CLEARは93.7の最先端のPDMSを達成した。
以上の結果から,高忠実なマルチモーダルプランニングを高密度な幾何学的アノテーションや反復的なサンプリングを使わずに効率的に実行できることが示唆された。
関連論文リスト
- Multimodal Action Diffusion for Robust End-to-End Autonomous Driving [0.0]
Action Diffusion Transformer (ADT) は、MSE目標で訓練されたアンカーフリーな拡散変圧器である。
1つの決定論的コマンドにコミットするのではなく、ADTはKアクション候補を生成し、推論時に最も適したコマンドを選択する。
ADTは、挑戦的なクローズループベンチマークであるBench2Driveの10倍のレイテンシを実現しながら、これまでの最先端を越えている。
論文 参考訳(メタデータ) (2026-06-01T11:35:35Z) - Precise: SDE-Consistent Stochastic Sampling for RL Post-Training of Flow-Matching Models [56.67321805551389]
Reinforcement Learning (RL) は, 拡散・流れマッチングジェネレータにおいて, 迅速なアライメントと知覚品質の向上に有効な方法となっている。
探索行動の制御と力学のデノベーションを行うサンプルは、この方針の一部である。
有効探査と安定性のバランスをとる新しいサンプリング器を提案する。
論文 参考訳(メタデータ) (2026-05-22T11:37:22Z) - HAD: Combining Hierarchical Diffusion with Metric-Decoupled RL for End-to-End Driving [51.268878540511054]
我々は階層的拡散政策を備えたエンドツーエンドの計画フレームワークであるHADを提案する。
我々は,NAVSIMとHUGSIMの両方でHADが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-04T04:12:47Z) - MeanFuser: Fast One-Step Multi-Modal Trajectory Generation and Adaptive Reconstruction via MeanFlow for End-to-End Autonomous Driving [23.013043338076745]
MeanFuserはエンドツーエンドの自動運転方式だ。
GMNを導入し、生成サンプリングをガイドし、MeanFlow Identityをエンドツーエンドプランニングに適用する。
NAVSIMクローズドループベンチマークの実験は、PDMスコアの監督なしにMeanFuserが優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2026-02-23T17:17:26Z) - A Unified Candidate Set with Scene-Adaptive Refinement via Diffusion for End-to-End Autonomous Driving [11.096777574777406]
固定軌跡語彙は、定期運転において安定したカバレッジを提供するが、しばしば複雑な相互作用において最適解を見逃す。
そこで我々は,CdDriveを提案する。このCdDriveは,元の語彙候補を保存し,語彙条件付き拡散復調によって生成されたシーン適応型候補を付加する。
どちらの候補も共有選択モジュールによって共同でスコア付けされ、ルーチンと高度にインタラクティブなシナリオで信頼性の高いパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-02-03T05:14:08Z) - EvaDrive: Evolutionary Adversarial Policy Optimization for End-to-End Autonomous Driving [17.57364638932072]
EvaDriveは、自動運転のための新しい強化学習フレームワークである。
ヒューマンライクな反復的意思決定のためのクローズドループ対向フレームワークを提供する。
NAVSIMとBench2Driveベンチマークの大規模な実験では、SOTAのパフォーマンスが示されている。
論文 参考訳(メタデータ) (2025-08-05T11:26:28Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。