論文の概要: ParkDiffusion++: Ego Intention Conditioned Joint Multi-Agent Trajectory Prediction for Automated Parking using Diffusion Models
- arxiv url: http://arxiv.org/abs/2602.20923v1
- Date: Tue, 24 Feb 2026 14:01:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.671676
- Title: ParkDiffusion++: Ego Intention Conditioned Joint Multi-Agent Trajectory Prediction for Automated Parking using Diffusion Models
- Title(参考訳): ParkDiffusion++: 拡散モデルを用いた自動駐車のためのエゴ意図条件付きマルチエージェント軌道予測
- Authors: Jiarong Wei, Anna Rehr, Christian Feist, Abhinav Valada,
- Abstract要約: マルチモーダルエゴ意図予測器とエゴ条件付きマルチエージェント関節軌道予測器を共同で学習するParkDiffusion++を提案する。
ParkDiffusion++はDragon Lake ParkingデータセットとIntersections Droneデータセットで最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 14.674456578222843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated parking is a challenging operational domain for advanced driver assistance systems, requiring robust scene understanding and interaction reasoning. The key challenge is twofold: (i) predict multiple plausible ego intentions according to context and (ii) for each intention, predict the joint responses of surrounding agents, enabling effective what-if decision-making. However, existing methods often fall short, typically treating these interdependent problems in isolation. We propose ParkDiffusion++, which jointly learns a multi-modal ego intention predictor and an ego-conditioned multi-agent joint trajectory predictor for automated parking. Our approach makes several key contributions. First, we introduce an ego intention tokenizer that predicts a small set of discrete endpoint intentions from agent histories and vectorized map polylines. Second, we perform ego-intention-conditioned joint prediction, yielding socially consistent predictions of the surrounding agents for each possible ego intention. Third, we employ a lightweight safety-guided denoiser with different constraints to refine joint scenes during training, thus improving accuracy and safety. Fourth, we propose counterfactual knowledge distillation, where an EMA teacher refined by a frozen safety-guided denoiser provides pseudo-targets that capture how agents react to alternative ego intentions. Extensive evaluations demonstrate that ParkDiffusion++ achieves state-of-the-art performance on the Dragon Lake Parking (DLP) dataset and the Intersections Drone (inD) dataset. Importantly, qualitative what-if visualizations show that other agents react appropriately to different ego intentions.
- Abstract(参考訳): 自動駐車は、高度な運転支援システムにとって困難な運用領域であり、堅牢なシーン理解と相互作用の推論を必要とする。
主な課題は2つある。
一 文脈に応じて複数のもっともらしい自我の意図を予測すること
2) 各意図に対して, 周囲のエージェントの協調反応を予測し, 効果的な意思決定を可能にする。
しかし、既存の手法はしばしば不足し、通常これらの相互依存的な問題を分離して扱う。
自動駐車のためのマルチモーダルエゴ意図予測器とエゴ条件付きマルチエージェント共同軌道予測器を共同で学習するParkDiffusion++を提案する。
私たちのアプローチにはいくつかの重要な貢献があります。
まず,エージェントヒストリーとベクトル化マップポリラインから,小さな離散的な終点意図の集合を予測するエゴ意図トークン化器を導入する。
第2に,エゴの意図ごとに周囲のエージェントの社会的に一貫した予測を行う。
第3に、トレーニング中の関節シーンを洗練させ、精度と安全性を向上させるために、異なる制約の軽量な安全誘導型デノイザーを用いる。
第4に,凍結した安全誘導デノイザによって精製されたEMA教師が,エージェントが代替のエゴ意図にどのように反応するかをキャプチャする擬似ターゲットを提供する,対物的知識蒸留を提案する。
大規模な評価によると、ParkDiffusion++はDragon Lake Parking(DLP)データセットとIntersections Drone(inD)データセットで最先端のパフォーマンスを達成する。
重要なことは、質的なWhat-if視覚化は、他のエージェントが異なるエゴの意図に適切に反応することを示している。
関連論文リスト
- FocalAD: Local Motion Planning for End-to-End Autonomous Driving [11.37427528557442]
エンドツーエンドの自動運転では、運動予測は自走車計画において重要な役割を果たす。
既存の手法はしばしばグローバルに集約された動作特徴に依存しており、計画決定は主に少数の局所的相互作用エージェントの影響を受けているという事実を無視している。
本稿では,FocalADを提案する。FocalADは,局所的な動きの表現の強化によって,重要な地域住民とプランニングに焦点をあてた新しいフレームワークである。
論文 参考訳(メタデータ) (2025-06-13T02:39:01Z) - ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models [6.58562706945347]
ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
論文 参考訳(メタデータ) (2025-05-01T15:16:59Z) - Transfer Your Perspective: Controllable 3D Generation from Any Viewpoint in a Driving Scene [56.73568220959019]
共同自動運転(CAV)は有望な方向のようだが、開発のためのデータ収集は簡単ではない。
本研究では,運転シーンにおける異なる視点から現実的な知覚を生み出すことを目的とした,救助支援のための新しいサロゲートを提案する。
シミュレーションされたコラボレーティブデータと実車データを組み合わせた,最初のソリューションを提案する。
論文 参考訳(メタデータ) (2025-02-10T17:07:53Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - PPAD: Iterative Interactions of Prediction and Planning for End-to-end Autonomous Driving [57.89801036693292]
PPAD(Iterative Interaction of Prediction and Planning Autonomous Driving)は、予測と計画のより良い統合を目的とした、タイムステップワイドなインタラクションである。
我々は,階層的動的キーオブジェクトに着目したego-to-agent,ego-to-map,ego-to-BEVインタラクション機構を設計し,インタラクションをモデル化する。
論文 参考訳(メタデータ) (2023-11-14T11:53:24Z) - Domain Knowledge Driven Pseudo Labels for Interpretable Goal-Conditioned
Interactive Trajectory Prediction [29.701029725302586]
目標条件付きフレームワークを用いた共同軌道予測問題について検討する。
本研究では,条件付き変分自動エンコーダ(CVAE)モデルを導入し,異なる相互作用モードを潜在空間に明示的にエンコードする。
KLの消滅を回避する新しい手法を提案し、擬似ラベルを用いた解釈可能な対話型潜在空間を誘導する。
論文 参考訳(メタデータ) (2022-03-28T21:41:21Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。