論文の概要: Multi-modal anticipation of stochastic trajectories in a dynamic
environment with Conditional Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2103.03912v1
- Date: Fri, 5 Mar 2021 19:38:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 13:51:14.205669
- Title: Multi-modal anticipation of stochastic trajectories in a dynamic
environment with Conditional Variational Autoencoders
- Title(参考訳): 条件付き変分オートエンコーダを用いた動的環境における確率軌道のマルチモーダル予測
- Authors: Albert Dulian, John C. Murray
- Abstract要約: 近くの車両の短期的な動きは、厳密に単一の軌道のセットに限定されません。
本稿では, エージェントの過去の動作に条件付き条件付きオートエンコーダ(C-VAE)と, カプセルネットワーク(Capsule Network, CapsNet)で符号化されたシーンを用いて, 問題のマルチモーダル性を考慮することを提案する。
さらに,N個のサンプルに対して最小値を用いることの利点を実証し,最も近いサンプルに対する損失を最小化しようと試み,より多様な予測を導いた。
- 参考スコア(独自算出の注目度): 0.12183405753834559
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Forecasting short-term motion of nearby vehicles presents an inherently
challenging issue as the space of their possible future movements is not
strictly limited to a set of single trajectories. Recently proposed techniques
that demonstrate plausible results concentrate primarily on forecasting a fixed
number of deterministic predictions, or on classifying over a wide variety of
trajectories that were previously generated using e.g. dynamic model. This
paper focuses on addressing the uncertainty associated with the discussed task
by utilising the stochastic nature of generative models in order to produce a
diverse set of plausible paths with regards to tracked vehicles. More
specifically, we propose to account for the multi-modality of the problem with
use of Conditional Variational Autoencoder (C-VAE) conditioned on an agent's
past motion as well as a rasterised scene context encoded with Capsule Network
(CapsNet). In addition, we demonstrate advantages of employing the Minimum over
N (MoN) cost function which measures the distance between ground truth and N
generated samples and tries to minimise the loss with respect to the closest
sample, effectively leading to more diverse predictions. We examine our network
on a publicly available dataset against recent state-of-the-art methods and
show that our approach outperforms these techniques in numerous scenarios
whilst significantly reducing the number of trainable parameters as well as
allowing to sample an arbitrary amount of diverse trajectories.
- Abstract(参考訳): 近くの車両の短期的な動きを予測することは本質的に困難な問題であり、将来の動きの可能性は単一の軌道の集合に限定されていない。
最近提案された手法は、主に固定数の決定論的予測を予測すること、あるいは以前に生成された様々な軌道を分類することに集中している。
動的モデル。
本論文では,生成モデルの確率的性質を利用して,追跡された車両に関する多様な経路を生成することにより,議論されたタスクに関連する不確実性に対処することに焦点を当てる。
具体的には,C-VAE(Conditional Variational Autoencoder)とCapsule Network(CapsNet)でエンコードされたラスタライズされたシーンコンテキストを用いて,この問題の多モード性を考慮することを提案する。
さらに,N(MoN)コスト関数を用いて,N(MoN)コスト関数を用いて,真理とN(N)生成サンプルの距離を計測し,最も近いサンプルに対する損失を最小化し,より多様な予測を導出する利点を示す。
我々は,最近の最先端手法に対する公開データセット上での我々のネットワークを検証し,学習可能なパラメータの数を大幅に削減しつつ,任意の量の多種多様なトラジェクタをサンプリングできる手法が,多くのシナリオでこれらの手法を上回っていることを示す。
関連論文リスト
- Controllable Diverse Sampling for Diffusion Based Motion Behavior
Forecasting [11.106812447960186]
制御可能拡散軌道(CDT)と呼ばれる新しい軌道生成器を導入する。
CDTは、情報と社会的相互作用をトランスフォーマーに基づく条件記述拡散モデルに統合し、将来の軌跡の予測を導く。
マルチモーダル性を確保するため,直進,右折,左折などの軌道モードを指示する行動トークンを組み込んだ。
論文 参考訳(メタデータ) (2024-02-06T13:16:54Z) - DICE: Diverse Diffusion Model with Scoring for Trajectory Prediction [7.346307332191997]
本稿では,拡散モデルを用いて将来の軌跡を計算的に効率的に予測するフレームワークを提案する。
提案手法は, 試料軌道数を最大化し, 精度を向上させるための効率的なサンプリング機構である。
本研究では,一般歩行者(UCY/ETH)と自律走行(nuScenes)のベンチマークデータを用いて,経験的評価を行うことによるアプローチの有効性を示す。
論文 参考訳(メタデータ) (2023-10-23T05:04:23Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z) - Diverse and Admissible Trajectory Forecasting through Multimodal Context
Understanding [46.52703817997932]
自律走行におけるマルチエージェント軌道予測には、周囲の車両や歩行者の挙動を正確に予測するエージェントが必要である。
マルチモーダル世界から複数の入力信号を合成するモデルを提案する。
従来の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-06T13:59:39Z) - A Multi-Channel Neural Graphical Event Model with Negative Evidence [76.51278722190607]
イベントデータセットは、タイムライン上で不規則に発生するさまざまなタイプのイベントのシーケンスである。
基礎となる強度関数を推定するために,非パラメトリックディープニューラルネットワーク手法を提案する。
論文 参考訳(メタデータ) (2020-02-21T23:10:50Z) - MCENET: Multi-Context Encoder Network for Homogeneous Agent Trajectory
Prediction in Mixed Traffic [35.22312783822563]
都市混合交通圏における軌道予測は多くのインテリジェント交通システムにとって重要である。
本稿では,過去と未来の両方のシーンコンテキストを符号化して学習するマルチコンテキストネットワーク(MCENET)を提案する。
推定時間において,対象エージェントの過去の状況と動作情報と潜伏変数のサンプリングを組み合わせ,複数の現実的軌跡を予測する。
論文 参考訳(メタデータ) (2020-02-14T11:04:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。