論文の概要: ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.00586v1
- Date: Thu, 01 May 2025 15:16:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.34876
- Title: ParkDiffusion: Heterogeneous Multi-Agent Multi-Modal Trajectory Prediction for Automated Parking using Diffusion Models
- Title(参考訳): ParkDiffusion:拡散モデルを用いた自動駐車のための不均一なマルチエージェント多モード軌道予測
- Authors: Jiarong Wei, Niclas Vödisch, Anna Rehr, Christian Feist, Abhinav Valada,
- Abstract要約: ParkDiffusionは、自動駐車シナリオにおける車両と歩行者の両方の軌道を予測する新しいアプローチである。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉える。
我々は,Dragon Lake ParkingデータセットとIntersections DroneデータセットのParkDiffusionを評価する。
- 参考スコア(独自算出の注目度): 6.58562706945347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated parking is a critical feature of Advanced Driver Assistance Systems (ADAS), where accurate trajectory prediction is essential to bridge perception and planning modules. Despite its significance, research in this domain remains relatively limited, with most existing studies concentrating on single-modal trajectory prediction of vehicles. In this work, we propose ParkDiffusion, a novel approach that predicts the trajectories of both vehicles and pedestrians in automated parking scenarios. ParkDiffusion employs diffusion models to capture the inherent uncertainty and multi-modality of future trajectories, incorporating several key innovations. First, we propose a dual map encoder that processes soft semantic cues and hard geometric constraints using a two-step cross-attention mechanism. Second, we introduce an adaptive agent type embedding module, which dynamically conditions the prediction process on the distinct characteristics of vehicles and pedestrians. Third, to ensure kinematic feasibility, our model outputs control signals that are subsequently used within a kinematic framework to generate physically feasible trajectories. We evaluate ParkDiffusion on the Dragon Lake Parking (DLP) dataset and the Intersections Drone (inD) dataset. Our work establishes a new baseline for heterogeneous trajectory prediction in parking scenarios, outperforming existing methods by a considerable margin.
- Abstract(参考訳): 自動駐車はAdvanced Driver Assistance Systems (ADAS) の重要な特徴であり、正確な軌道予測は知覚と計画モジュールの橋渡しに不可欠である。
その重要性にもかかわらず、この領域の研究は比較的限られており、既存のほとんどの研究は車両の単一モード軌道予測に集中している。
本研究では,自動駐車シナリオにおける車両と歩行者の軌跡を予測する新しいアプローチであるParkDiffusionを提案する。
ParkDiffusionは拡散モデルを用いて、将来の軌道の固有の不確実性と多モード性を捉え、いくつかの重要な革新を取り入れている。
まず,2段階のクロスアテンション機構を用いて,ソフトセマンティックキューとハード幾何制約を処理するデュアルマップエンコーダを提案する。
第2に,車両や歩行者の特徴を動的に予測する適応エージェント型埋込モジュールを提案する。
第3に,キネマティックな実現性を確保するため,このモデルでは,その後キネマティックなフレームワーク内で使用される制御信号を出力し,物理的に実現可能な軌道を生成する。
我々は、DLPデータセットとIntersections Drone(inD)データセットのParkDiffusionを評価する。
我々の研究は、駐車シナリオにおける異種軌道予測のための新しいベースラインを確立し、既存の手法をかなりの差で上回っている。
関連論文リスト
- TransParking: A Dual-Decoder Transformer Framework with Soft Localization for End-to-End Automatic Parking [2.209921757303168]
本稿では,専門的軌跡を用いて訓練したエンドツーエンド自動駐車のための視覚ベーストランスフォーマーモデルを提案する。
実験結果から, モデルの誤差は50%程度減少していることがわかった。
論文 参考訳(メタデータ) (2025-03-08T05:41:24Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - A Novel Temporal Multi-Gate Mixture-of-Experts Approach for Vehicle
Trajectory and Driving Intention Prediction [0.0]
正確な車両軌道予測は、自動車両と高度な運転支援システムにとって重要である。
運転意図と車両運動には有意な相関関係がある。
本稿では,車両軌道と運転意図を同時に予測する時間的マルチゲート混合実験モデルを提案する。
論文 参考訳(メタデータ) (2023-08-01T13:26:59Z) - An End-to-End Vehicle Trajcetory Prediction Framework [3.7311680121118345]
将来の軌道の正確な予測は、以前の軌道に依存するだけでなく、近くの他の車両間の複雑な相互作用のシミュレーションにも依存する。
この問題に対処するために構築されたほとんどの最先端のネットワークは、軌跡をたどって容易に利用できると仮定している。
本稿では,生のビデオ入力を取り込み,将来の軌跡予測を出力する新しいエンドツーエンドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-04-19T15:42:03Z) - Decentralized Vehicle Coordination: The Berkeley DeepDrive Drone Dataset and Consensus-Based Models [76.32775745488073]
本研究では,非構造環境における動作計画の研究を目的とした,新しいデータセットとモデリングフレームワークを提案する。
コンセンサスに基づくモデリング手法により、データセットで観測された優先順位の出現を効果的に説明できることを実証する。
論文 参考訳(メタデータ) (2022-09-19T05:06:57Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z) - Spatio-Temporal Graph Dual-Attention Network for Multi-Agent Prediction
and Tracking [23.608125748229174]
異種エージェントを含む多エージェント軌道予測のための汎用生成ニューラルシステムを提案する。
提案システムは, 軌道予測のための3つのベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-02-18T02:25:35Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z) - ParkPredict: Motion and Intent Prediction of Vehicles in Parking Lots [65.33650222396078]
我々は、駐車場環境を開発し、人間の駐車操作のデータセットを収集する。
本稿では,多モード長短期記憶(LSTM)予測モデルと畳み込みニューラルネットワークLSTM(CNN-LSTM)を物理ベースの拡張カルマンフィルタ(EKF)ベースラインと比較する。
以上の結果から,1) 意図をよく推定できる(LSTMとCNN-LSTMモデルによる約85% のトップ1精度と100% トップ3精度),2) 運転者の意図する駐車場所の知識が駐車軌跡の予測に大きく影響すること,3) 環境の意味的表現について考察した。
論文 参考訳(メタデータ) (2020-04-21T20:46:32Z) - A Multi-Modal States based Vehicle Descriptor and Dilated Convolutional
Social Pooling for Vehicle Trajectory Prediction [3.131740922192114]
本稿では,この問題を解決するために,拡張畳み込み社会プーリング(VD+DCS-LSTM)を用いた車両記述子に基づくLSTMモデルを提案する。
各車両のマルチモーダル状態情報がモデル入力として使用される。
モデル全体の妥当性はNGSIM US-101とI-80データセットで検証された。
論文 参考訳(メタデータ) (2020-03-07T01:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。