論文の概要: TrajDiff: End-to-end Autonomous Driving without Perception Annotation
- arxiv url: http://arxiv.org/abs/2512.00723v1
- Date: Sun, 30 Nov 2025 04:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.382274
- Title: TrajDiff: End-to-end Autonomous Driving without Perception Annotation
- Title(参考訳): TrajDiff: 知覚アノテーションのないエンドツーエンドの自動運転
- Authors: Xingtai Gui, Jianbo Zhao, Wencheng Han, Jikai Wang, Jiahao Gong, Feiyang Tan, Cheng-zhong Xu, Jianbing Shen,
- Abstract要約: エンドツーエンドの自動運転システムは、生センサ入力から直接駆動ポリシーを生成する。
TrajDiffはTrajectory-oriented BEV Conditioned Diffusionフレームワークであり、エンドツーエンドの自動運転のための知覚アノテーションのない生成方法を確立する。
NAVSIMベンチマークで評価すると、TrajDiffは87.5 PDMSを達成した。
- 参考スコア(独自算出の注目度): 65.49718343700319
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: End-to-end autonomous driving systems directly generate driving policies from raw sensor inputs. While these systems can extract effective environmental features for planning, relying on auxiliary perception tasks, developing perception annotation-free planning paradigms has become increasingly critical due to the high cost of manual perception annotation. In this work, we propose TrajDiff, a Trajectory-oriented BEV Conditioned Diffusion framework that establishes a fully perception annotation-free generative method for end-to-end autonomous driving. TrajDiff requires only raw sensor inputs and future trajectory, constructing Gaussian BEV heatmap targets that inherently capture driving modalities. We design a simple yet effective trajectory-oriented BEV encoder to extract the TrajBEV feature without perceptual supervision. Furthermore, we introduce Trajectory-oriented BEV Diffusion Transformer (TB-DiT), which leverages ego-state information and the predicted TrajBEV features to directly generate diverse yet plausible trajectories, eliminating the need for handcrafted motion priors. Beyond architectural innovations, TrajDiff enables exploration of data scaling benefits in the annotation-free setting. Evaluated on the NAVSIM benchmark, TrajDiff achieves 87.5 PDMS, establishing state-of-the-art performance among all annotation-free methods. With data scaling, it further improves to 88.5 PDMS, which is comparable to advanced perception-based approaches. Our code and model will be made publicly available.
- Abstract(参考訳): エンドツーエンドの自動運転システムは、生センサ入力から直接駆動ポリシーを生成する。
これらのシステムでは、補助的な知覚タスクを頼りに、効果的な環境特徴を抽出できるが、手動認識アノテーションのコストが高いため、認識のない計画パラダイムの開発がますます重要になっている。
そこで本研究では,TrajDiffを提案する。TrajDiffは,自動走行のための完全認識アノテーションのない生成手法を構築する,軌道指向型BEV条件付き拡散フレームワークである。
TrajDiffは生のセンサー入力と将来の軌道のみを必要とする。
我々は,TrajBEV特徴を知覚的監督なしに抽出する,シンプルで効果的な軌道指向型BEVエンコーダを設計する。
さらに、エゴ状態情報と予測されたTrajBEV特徴を活用して、多種多様な可塑性軌道を直接生成し、手作りの動作前処理を不要とするトラジェクトリ指向BEV拡散変換器(TB-DiT)を導入する。
アーキテクチャの革新以外にも、TrajDiffは、アノテーションのない設定でデータスケーリングのメリットを探索できる。
NAVSIMベンチマークで評価すると、TrajDiffは87.5 PDMSを達成し、すべてのアノテーションのないメソッドで最先端のパフォーマンスを確立する。
データスケーリングにより、より高度な知覚ベースのアプローチに匹敵する88.5 PDMSに改善される。
私たちのコードとモデルは公開されます。
関連論文リスト
- DiffRefiner: Coarse to Fine Trajectory Planning via Diffusion Refinement with Semantic Interaction for End to End Autonomous Driving [28.22372133560876]
本稿では,新しい2段階軌道予測フレームワークDiffRefinerを提案する。
最初のステージでは、トランスフォーマーベースの提案デコーダを使用して、粗い軌道予測を生成する。
第2段階では拡散精錬器が適用され、これらの初期予測を反復的に復調する。
論文 参考訳(メタデータ) (2025-11-21T11:16:00Z) - FlowDrive: Energy Flow Field for End-to-End Autonomous Driving [50.89871153094958]
FlowDriveは、物理的に解釈可能なエネルギーベースのフローフィールドを導入し、セマンティックな前提と安全性をBEV空間にエンコードする新しいフレームワークである。
NAVSIM v2ベンチマークの実験では、FlowDriveが最先端のパフォーマンスを86.3で達成し、安全性と計画品質の両方において以前のベースラインを超えたことが示されている。
論文 参考訳(メタデータ) (2025-09-17T13:51:33Z) - Hierarchical End-to-End Autonomous Driving: Integrating BEV Perception with Deep Reinforcement Learning [23.21761407287525]
エンドツーエンドの自動運転は、従来のモジュラーパイプラインに代わる合理化された代替手段を提供する。
深層強化学習(Dep Reinforcement Learning, DRL)は、最近この分野で注目を集めている。
DRL特徴抽出ネットワークを認識フェーズに直接マッピングすることで、このギャップを埋める。
論文 参考訳(メタデータ) (2024-09-26T09:14:16Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。