論文の概要: A Knowledge-Driven Diffusion Policy for End-to-End Autonomous Driving Based on Expert Routing
- arxiv url: http://arxiv.org/abs/2509.04853v1
- Date: Fri, 05 Sep 2025 07:07:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.502371
- Title: A Knowledge-Driven Diffusion Policy for End-to-End Autonomous Driving Based on Expert Routing
- Title(参考訳): エキスパートルーティングに基づくエンドツーエンド自動運転のための知識駆動拡散政策
- Authors: Chengkai Xu, Jiaqi Liu, Yicheng Guo, Peng Hang, Jian Sun,
- Abstract要約: 本稿では,知識駆動型拡散モデルであるKDPと,スパース・ミックス・オブ・エキスパート・ルーティング機構の統合について述べる。
代表的な運転シナリオに対する実験では、KDPは一般的なパラダイムに比べて、成功率の向上、衝突リスクの低減、制御の円滑化を一貫して達成している。
これらの結果は、知識駆動型エンドツーエンド自動運転のためのスケーラブルで解釈可能なパラダイムとして、エキスパートルーティングと拡散を確立する。
- 参考スコア(独自算出の注目度): 43.930171390617055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end autonomous driving remains constrained by the need to generate multi-modal actions, maintain temporal stability, and generalize across diverse scenarios. Existing methods often collapse multi-modality, struggle with long-horizon consistency, or lack modular adaptability. This paper presents KDP, a knowledge-driven diffusion policy that integrates generative diffusion modeling with a sparse mixture-of-experts routing mechanism. The diffusion component generates temporally coherent and multi-modal action sequences, while the expert routing mechanism activates specialized and reusable experts according to context, enabling modular knowledge composition. Extensive experiments across representative driving scenarios demonstrate that KDP achieves consistently higher success rates, reduced collision risk, and smoother control compared to prevailing paradigms. Ablation studies highlight the effectiveness of sparse expert activation and the Transformer backbone, and activation analyses reveal structured specialization and cross-scenario reuse of experts. These results establish diffusion with expert routing as a scalable and interpretable paradigm for knowledge-driven end-to-end autonomous driving.
- Abstract(参考訳): エンドツーエンドの自動運転は、マルチモーダルなアクションを生成し、時間的安定性を維持し、さまざまなシナリオにまたがって一般化する必要があるため、依然として制約されている。
既存の手法は、しばしばマルチモダリティを崩壊させ、長期の一貫性に苦しむか、モジュール適応性に欠ける。
本稿では,知識駆動型拡散モデルであるKDPと,スパース・ミックス・オブ・エキスパート・ルーティング機構の統合について述べる。
拡散成分は時間的コヒーレントかつマルチモーダルなアクションシーケンスを生成し、専門家ルーティング機構はコンテキストに応じて専門的で再利用可能な専門家を活性化し、モジュール的知識合成を可能にする。
代表的な運転シナリオにまたがる広範囲な実験により、KDPは成功率を一貫して向上し、衝突リスクを低減し、一般的なパラダイムよりもスムーズな制御を達成できることを示した。
アブレーション研究は、スパース専門家活性化とトランスフォーマーバックボーンの有効性を強調し、アクティベーション分析により、専門家の構造化された特殊化とクロスシナリオの再利用を明らかにする。
これらの結果は、知識駆動型エンドツーエンド自動運転のためのスケーラブルで解釈可能なパラダイムとして、エキスパートルーティングと拡散を確立する。
関連論文リスト
- Drift-aware Collaborative Assistance Mixture of Experts for Heterogeneous Multistream Learning [31.877595633244734]
現実のシナリオにおける複数のデータストリームからの学習は、本質的に不均一性と予測不可能な概念の漂流のため、基本的に困難である。
既存の手法は通常、均質なストリームを仮定し、無差別な知識融合を持つ静的アーキテクチャを用いる。
CAMELは,各ストリームに専用の特徴抽出器とタスク固有ヘッドを付加した独立系を割り当てるフレームワークである。
さらに,ドリフトに対する専門家のライフサイクルを動的に管理する自律エキスパートタナー(AET)戦略を提案する。
論文 参考訳(メタデータ) (2025-08-03T05:35:34Z) - Breaking Imitation Bottlenecks: Reinforced Diffusion Powers Diverse Trajectory Generation [20.106116218594266]
DIVERは、強化学習と拡散ベースの生成を統合するエンドツーエンドの自動運転フレームワークである。
また,DIVERは軌道の多様性を著しく改善し,模倣学習に固有のモード崩壊問題に効果的に対処することを示した。
論文 参考訳(メタデータ) (2025-07-05T14:19:19Z) - Rethinking Explainability in the Era of Multimodal AI [9.57008593971486]
マルチモーダルAIシステムはユビキタスになり、ハイテイクなアプリケーションにまたがって優れたパフォーマンスを実現している。
既存の説明可能性のテクニックの多くは単調のままであり、モダリティ固有の特徴属性、概念、回路トレースを分離して生成する。
本稿では, マルチモーダルモデル決定を駆動するクロスモーダルな影響を, 体系的に誤表現し, 捉えることができないことを論じる。
論文 参考訳(メタデータ) (2025-06-16T03:08:29Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Planning-Aware Diffusion Networks for Enhanced Motion Forecasting in Autonomous Driving [0.0]
Planning-Integrated Forecasting Model (PIFM)は、脳における意思決定とマルチエージェント協調を管理する神経機構にインスパイアされた新しいフレームワークである。
PIFMはシナリオ内の全てのエージェントの将来の軌跡を予測することができる。
このアーキテクチャは、外部刺激やその他のエージェントの行動に基づいた予測を動的に調整する脳の手法と平行して、モデルの透明性を高める。
論文 参考訳(メタデータ) (2024-10-25T15:44:51Z) - DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.8837864849534]
我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-09T14:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。