論文の概要: Controllable Diverse Sampling for Diffusion Based Motion Behavior
Forecasting
- arxiv url: http://arxiv.org/abs/2402.03981v1
- Date: Tue, 6 Feb 2024 13:16:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 14:55:36.648549
- Title: Controllable Diverse Sampling for Diffusion Based Motion Behavior
Forecasting
- Title(参考訳): 拡散に基づく動きの予測のための可制御型横サンプリング
- Authors: Yiming Xu, Hao Cheng, Monika Sester
- Abstract要約: 制御可能拡散軌道(CDT)と呼ばれる新しい軌道生成器を導入する。
CDTは、情報と社会的相互作用をトランスフォーマーに基づく条件記述拡散モデルに統合し、将来の軌跡の予測を導く。
マルチモーダル性を確保するため,直進,右折,左折などの軌道モードを指示する行動トークンを組み込んだ。
- 参考スコア(独自算出の注目度): 11.106812447960186
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In autonomous driving tasks, trajectory prediction in complex traffic
environments requires adherence to real-world context conditions and behavior
multimodalities. Existing methods predominantly rely on prior assumptions or
generative models trained on curated data to learn road agents' stochastic
behavior bounded by scene constraints. However, they often face mode averaging
issues due to data imbalance and simplistic priors, and could even suffer from
mode collapse due to unstable training and single ground truth supervision.
These issues lead the existing methods to a loss of predictive diversity and
adherence to the scene constraints. To address these challenges, we introduce a
novel trajectory generator named Controllable Diffusion Trajectory (CDT), which
integrates map information and social interactions into a Transformer-based
conditional denoising diffusion model to guide the prediction of future
trajectories. To ensure multimodality, we incorporate behavioral tokens to
direct the trajectory's modes, such as going straight, turning right or left.
Moreover, we incorporate the predicted endpoints as an alternative behavioral
token into the CDT model to facilitate the prediction of accurate trajectories.
Extensive experiments on the Argoverse 2 benchmark demonstrate that CDT excels
in generating diverse and scene-compliant trajectories in complex urban
settings.
- Abstract(参考訳): 自動運転タスクでは、複雑な交通環境における軌道予測には、実世界の状況条件と行動の多様性への順守が必要である。
既存の手法は、主に事前の仮定や、キュレーションされたデータで訓練された生成モデルに頼って、道路エージェントの確率的振る舞いをシーン制約によって学習している。
しかし、データ不均衡や単純な事前処理によるモード平均化の問題に直面し、不安定なトレーニングや単一地上の真実管理によるモード崩壊に悩まされることもしばしばあった。
これらの問題により、既存の手法は予測的な多様性を失い、シーンの制約に固執する。
これらの課題に対処するために,地図情報とソーシャルインタラクションをトランスフォーマーに基づく条件記述拡散モデルに統合し,将来の軌跡予測を導出する,制御可能拡散軌道(CDT)と呼ばれる新しいトラジェクタを導入する。
マルチモーダル性を確保するため,直進,右折,左折などの軌道モードを指示する行動トークンを組み込んだ。
さらに,予測された終端を代替行動トークンとしてCDTモデルに組み込んで,正確な軌道の予測を容易にする。
argoverse 2ベンチマークの広範な実験は、複雑な都市環境においてcdtが多様でシーンに準拠した軌跡を生成するのに優れていることを示している。
関連論文リスト
- Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Tractable Joint Prediction and Planning over Discrete Behavior Modes for
Urban Driving [15.671811785579118]
自己回帰閉ループモデルのパラメータ化は,再学習を伴わずに可能であることを示す。
離散潜在モード上での完全反応性閉ループ計画を提案する。
当社のアプローチは、CARLAにおける従来の最先端技術よりも、高密度なトラフィックシナリオに挑戦する上で優れています。
論文 参考訳(メタデータ) (2024-03-12T01:00:52Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - A Diffusion-Model of Joint Interactive Navigation [14.689298253430568]
本稿では,交通シナリオを生成する拡散に基づくDJINNを提案する。
我々のアプローチは、過去、現在、未来からのフレキシブルな状態観察のセットに基づいて、全てのエージェントの軌跡を共同で拡散させる。
本稿では,DJINNが様々な条件分布からの直接的テスト時間サンプリングを柔軟に行う方法を示す。
論文 参考訳(メタデータ) (2023-09-21T22:10:20Z) - Planning with Occluded Traffic Agents using Bi-Level Variational
Occlusion Models [37.09462631862042]
閉鎖された交通機関との推論は、自動運転車の計画にとって大きなオープンな課題である。
近年のディープラーニングモデルでは、近隣の可視エージェントの挙動に基づいた隠蔽エージェントの予測に顕著な結果が示されている。
まず, 隠蔽剤の位置を予測し, 隠蔽剤の軌跡を推定する2段階生成モデルであるBi-level Variational Occlusion Models (BiVO)を提案する。
論文 参考訳(メタデータ) (2022-10-26T09:39:31Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z) - Multi-modal anticipation of stochastic trajectories in a dynamic
environment with Conditional Variational Autoencoders [0.12183405753834559]
近くの車両の短期的な動きは、厳密に単一の軌道のセットに限定されません。
本稿では, エージェントの過去の動作に条件付き条件付きオートエンコーダ(C-VAE)と, カプセルネットワーク(Capsule Network, CapsNet)で符号化されたシーンを用いて, 問題のマルチモーダル性を考慮することを提案する。
さらに,N個のサンプルに対して最小値を用いることの利点を実証し,最も近いサンプルに対する損失を最小化しようと試み,より多様な予測を導いた。
論文 参考訳(メタデータ) (2021-03-05T19:38:26Z) - Multimodal Trajectory Prediction via Topological Invariance for
Navigation at Uncontrolled Intersections [45.508973373913946]
道路交差点において,信号機や信号機を使わずに複数の非通信的合理的エージェント間の分散ナビゲーションに着目した。
我々の重要な洞察は、交差点の幾何学的構造と、効率的に動くエージェントのインセンティブが衝突を避け(合理性)、起こりうる行動の空間を減少させるということである。
マルチエージェント交差点シーンにおける高次モードの軌道表現を再構成するデータ駆動型軌道予測機構であるMTPを設計する。
論文 参考訳(メタデータ) (2020-11-08T02:56:42Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。