論文の概要: EP-Diffuser: An Efficient Diffusion Model for Traffic Scene Generation and Prediction via Polynomial Representations
- arxiv url: http://arxiv.org/abs/2504.05422v1
- Date: Mon, 07 Apr 2025 18:45:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:30:43.043621
- Title: EP-Diffuser: An Efficient Diffusion Model for Traffic Scene Generation and Prediction via Polynomial Representations
- Title(参考訳): EPディフューザ:多項表現による交通シーン生成と予測のための効率的な拡散モデル
- Authors: Yue Yao, Mohamed-Khalil Bouzidi, Daniel Goehring, Joerg Reichardt,
- Abstract要約: 本稿では,EP-Diffuserについて紹介する。EP-Diffuserはパラメータ効率のよい拡散型生成モデルで,交通シーンの進化過程の分布を推定する。
道路レイアウトとエージェント履歴に基づいて,本モデルは予測器として機能し,多種多様なシーン継続を生成する。
EP-Diffuserを2つのSotAモデルと比較し、Argoverse 2データセット上での予測の精度と妥当性を検証した。
- 参考スコア(独自算出の注目度): 1.9191778789375846
- License:
- Abstract: As the prediction horizon increases, predicting the future evolution of traffic scenes becomes increasingly difficult due to the multi-modal nature of agent motion. Most state-of-the-art (SotA) prediction models primarily focus on forecasting the most likely future. However, for the safe operation of autonomous vehicles, it is equally important to cover the distribution for plausible motion alternatives. To address this, we introduce EP-Diffuser, a novel parameter-efficient diffusion-based generative model designed to capture the distribution of possible traffic scene evolutions. Conditioned on road layout and agent history, our model acts as a predictor and generates diverse, plausible scene continuations. We benchmark EP-Diffuser against two SotA models in terms of accuracy and plausibility of predictions on the Argoverse 2 dataset. Despite its significantly smaller model size, our approach achieves both highly accurate and plausible traffic scene predictions. We further evaluate model generalization ability in an out-of-distribution (OoD) test setting using Waymo Open dataset and show superior robustness of our approach. The code and model checkpoints can be found here: https://github.com/continental/EP-Diffuser.
- Abstract(参考訳): 予測の地平線が大きくなるにつれて,エージェント運動のマルチモーダルな性質のため,交通シーンの将来の進化を予測することがますます困難になる。
ほとんどの最先端(SotA)予測モデルは、最も可能性の高い未来を予測することに焦点を当てている。
しかし、自動運転車の安全運転には、可塑性運動代替品の分布をカバーすることが重要である。
そこで我々はEP-Diffuserを紹介した。EP-Diffuserはパラメータ効率のよい拡散型生成モデルである。
道路レイアウトとエージェント履歴に基づいて,本モデルは予測器として機能し,多種多様なシーン継続を生成する。
EP-Diffuserを2つのSotAモデルと比較し、Argoverse 2データセット上での予測の精度と妥当性を検証した。
モデルサイズはかなり小さいが,提案手法は精度が高く,交通シーンの予測も容易である。
さらに、Waymo Openデータセットを用いたOoDテスト設定におけるモデル一般化能力を評価し、我々のアプローチの優れた堅牢性を示す。
コードとモデルチェックポイントは、https://github.com/continental/EP-Diffuser.com/で確認できる。
関連論文リスト
- ASTRA: A Scene-aware TRAnsformer-based model for trajectory prediction [15.624698974735654]
ASTRA (A Scene-aware TRAnsformer based model for trajectory prediction) は軽量な歩行者軌道予測モデルである。
我々は、U-Netベースの特徴抽出器を用いて、その潜在ベクトル表現を用いて、シーン表現をキャプチャし、グラフ対応トランスフォーマーエンコーダを用いて、ソーシャルインタラクションをキャプチャする。
論文 参考訳(メタデータ) (2025-01-16T23:28:30Z) - Diffusion-Based Environment-Aware Trajectory Prediction [3.1406146587437904]
自動運転車の安全かつ効率的な運転には、交通参加者の将来の軌跡を予測する能力が不可欠である。
本稿では,多エージェント軌道予測のための拡散モデルを提案する。
このモデルは、交通参加者と環境の間の複雑な相互作用を捉え、データのマルチモーダルな性質を正確に学習することができる。
論文 参考訳(メタデータ) (2024-03-18T10:35:15Z) - Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.429396802848224]
本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文 参考訳(メタデータ) (2024-03-10T04:16:04Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - EquiDiff: A Conditional Equivariant Diffusion Model For Trajectory
Prediction [11.960234424309265]
本研究では,将来の車両軌道予測のための深部生成モデルであるEquiDiffを提案する。
EquiDiffは、過去の情報とランダムなガウスノイズを組み込んで将来の軌跡を生成する条件拡散モデルに基づいている。
以上の結果から,EquiDiffは短期予測では他のベースラインモデルよりも優れているが,長期予測では誤差が若干高いことがわかった。
論文 参考訳(メタデータ) (2023-08-12T13:17:09Z) - ADAPT: Efficient Multi-Agent Trajectory Prediction with Adaptation [0.0]
ADAPTはダイナミックウェイトラーニングによってシーン内の全てのエージェントの軌道を共同で予測するための新しいアプローチである。
提案手法は, 単一エージェントと複数エージェントの設定において, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-26T13:41:51Z) - LOPR: Latent Occupancy PRediction using Generative Models [49.15687400958916]
LiDARの生成した占有グリッドマップ(L-OGM)は、頑丈な鳥の視線シーンを表現している。
本稿では,学習空間内での表現学習と予測という,占有率予測を分離する枠組みを提案する。
論文 参考訳(メタデータ) (2022-10-03T22:04:00Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - LookOut: Diverse Multi-Future Prediction and Planning for Self-Driving [139.33800431159446]
LookOutは、環境を共同で知覚し、センサーデータから様々な未来を予測するアプローチである。
本モデルでは,大規模自動運転データセットにおいて,より多様性があり,サンプル効率のよい動き予測を行う。
論文 参考訳(メタデータ) (2021-01-16T23:19:22Z) - Long-Term Prediction of Lane Change Maneuver Through a Multilayer
Perceptron [5.267336573374459]
横方向情報や角度情報のない長期(510秒)レーン変更予測モデルを提案する。
ロジスティック回帰モデル、多層パーセプトロン(MLP)モデル、リカレントニューラルネットワーク(RNN)モデルを含む3つの予測モデルが導入されている。
評価結果から, 開発した予測モデルでは, 実車線変更操作の75%を平均8.05秒で捉えることができることがわかった。
論文 参考訳(メタデータ) (2020-06-23T05:32:40Z) - TPNet: Trajectory Proposal Network for Motion Prediction [81.28716372763128]
Trajectory Proposal Network (TPNet) は、新しい2段階の動作予測フレームワークである。
TPNetはまず、仮説の提案として将来の軌道の候補セットを生成し、次に提案の分類と修正によって最終的な予測を行う。
4つの大規模軌道予測データセットの実験は、TPNetが定量的かつ定性的に、最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-04-26T00:01:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。