論文の概要: HEAT: Heterogeneous End-to-End Autonomous Driving via Trajectory-Guided World Models
- arxiv url: http://arxiv.org/abs/2605.19631v1
- Date: Tue, 19 May 2026 10:12:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.274071
- Title: HEAT: Heterogeneous End-to-End Autonomous Driving via Trajectory-Guided World Models
- Title(参考訳): HEAT:軌道誘導型世界モデルによる不均一なエンドツーエンド自動運転
- Authors: Hoonhee Cho, Giwon Lee, Jae-Young Kang, Hyemin Yang, Heejun Park, Kuk-Jin Yoon,
- Abstract要約: エンドツーエンドの自動運転は、従来のモジュラーパイプラインに代わる魅力的な代替手段として登場した。
本稿では,計画軌道に関する学習を組織する軌道駆動学習パラダイムを提案する。
一つの統一モデルが、各ドメイン内で強いパフォーマンスを維持しながら、異種データセット上でトレーニング可能であることを示す。
- 参考スコア(独自算出の注目度): 50.18051979020699
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end autonomous driving has emerged as a compelling alternative to traditional modular pipelines by directly mapping raw sensor data to driving actions. While recent approaches achieve strong performance on single-domain datasets, their performance degrades significantly when trained jointly across multiple heterogeneous domains. In practice, however, autonomous systems must operate across diverse environments with heterogeneous distributions, including different cities, sensor configurations, and traffic patterns, without domain-specific retraining. This gap highlights a key challenge in multi-domain learning: domain-specific variations across heterogeneous domains introduce conflicting learning signals, driving models toward compromised solutions that are suboptimal across domains. To address this, we propose a trajectory-driven learning paradigm that organizes training around planning trajectories, enabling the model to capture domain-invariant representations of driving intent. Furthermore, we incorporate a world model that predicts future latent features conditioned on ego actions, improving feature consistency and mitigating domain-induced biases. We evaluate our approach on three benchmarks, nuScenes, NAVSIM, and the Waymo end-to-end dataset, and show substantial improvements over existing methods across all domains. Our results demonstrate that a single unified model can be trained on heterogeneous datasets while maintaining strong performance within each domain, highlighting a step toward scalable real-world deployment. We will make our code publicly available.
- Abstract(参考訳): エンドツーエンドの自動運転は、生のセンサーデータを運転行動に直接マッピングすることで、従来のモジュラーパイプラインに代わる魅力的な代替手段として登場した。
近年のアプローチでは、単一ドメインデータセット上での強いパフォーマンスが達成されているが、複数の異種ドメインを共同でトレーニングすると、そのパフォーマンスは大幅に低下する。
しかし、実際には、自律システムは、異なる都市、センサー構成、交通パターンを含む異質な分布を持つ多様な環境をドメイン固有のリトレーニングなしで運用する必要がある。
このギャップは、多分野学習における重要な課題を浮き彫りにする: 異種ドメイン間のドメイン固有のバリエーションは、競合する学習信号を導入し、ドメイン間で最適でない妥協されたソリューションに向かってモデルを駆動する。
そこで本研究では,計画軌道に関するトレーニングを組織する軌道駆動学習パラダイムを提案し,そのモデルが駆動意図のドメイン不変表現をキャプチャできるようにする。
さらに,エゴ行動に規定された将来の潜伏的特徴を予測し,特徴の整合性を改善し,ドメインに起因したバイアスを軽減する世界モデルを組み込んだ。
我々は3つのベンチマーク、nuScenes、NAVSIM、Waymoのエンドツーエンドデータセットに対するアプローチを評価し、すべてのドメインにまたがる既存のメソッドよりも大幅に改善されていることを示す。
我々の結果は、単一の統一モデルが、各ドメイン内で強力なパフォーマンスを維持しながら、異種データセットでトレーニング可能であることを実証し、スケーラブルな実世界のデプロイメントへの一歩を浮き彫りにしている。
コードを公開します。
関連論文リスト
- Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.37585797507323]
ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-13T10:07:28Z) - Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird's Eye View Segmentation for Connected and Autonomous Driving [49.03947018718156]
協調的な知覚の訓練と推論の段階で利用される統合されたドメイン一般化フレームワークを提案する。
また、システム内ドメインアライメント機構を導入し、コネクテッドおよび自律走行車間のドメインの差を減らし、潜在的に排除する。
論文 参考訳(メタデータ) (2023-11-28T12:52:49Z) - Foresee What You Will Learn: Data Augmentation for Domain Generalization
in Non-Stationary Environments [14.344721944207599]
既存のドメインの一般化は、目に見えないドメインでもうまく機能する一般化可能なモデルを学ぶことを目的としている。
本稿では,DDA(Directional Domain Augmentation)を提案する。DDA(Directional Domain Augmentation)は,ソースデータをドメイントランスフォーマーを介して拡張としてマッピングすることで,未確認のターゲット特徴をシミュレートする。
提案手法は, 合成データセットと実世界のデータセットの両方で評価し, 実験結果から, 提案手法が既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-01-19T01:51:37Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Multi-path Neural Networks for On-device Multi-domain Visual
Classification [55.281139434736254]
本稿では,モバイルデバイス上でのマルチドメイン視覚分類のためのマルチパスネットワークの自動学習手法を提案する。
提案するマルチパスネットワークは,各ドメインに1つの強化学習コントローラを適用して,MobileNetV3のような検索空間から生成されたスーパーネットワークの最適経路を選択することにより,ニューラルネットワーク検索から学習する。
決定されたマルチパスモデルは、個々のドメインパス内の非共有ノード内にドメイン固有のパラメータを保持しながら、共有ノード内のドメイン間でパラメータを選択的に共有する。
論文 参考訳(メタデータ) (2020-10-10T05:13:49Z) - Towards Adaptive Semantic Segmentation by Progressive Feature Refinement [16.40758125170239]
セグメンテーションネットワークの転送可能性を高めるために,ドメイン逆学習とともに,革新的なプログレッシブな特徴改善フレームワークを提案する。
その結果、ソース・ドメイン・イメージで訓練されたセグメンテーション・モデルは、大幅な性能劣化を伴わずにターゲット・ドメインに転送できる。
論文 参考訳(メタデータ) (2020-09-30T04:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。