論文の概要: LatentFormer: Multi-Agent Transformer-Based Interaction Modeling and
Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2203.01880v1
- Date: Thu, 3 Mar 2022 17:44:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 19:06:35.799023
- Title: LatentFormer: Multi-Agent Transformer-Based Interaction Modeling and
Trajectory Prediction
- Title(参考訳): latentformer:マルチエージェントトランスベースインタラクションモデリングと軌道予測
- Authors: Elmira Amirloo, Amir Rasouli, Peter Lakner, Mohsen Rohani, Jun Luo
- Abstract要約: 将来の車両軌道予測のためのトランスフォーマーモデルであるLatentFormerを提案する。
提案手法をnuScenesベンチマークデータセット上で評価し,提案手法が最先端性能を実現し,トラジェクトリ指標を最大40%向上することを示す。
- 参考スコア(独自算出の注目度): 12.84508682310717
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent trajectory prediction is a fundamental problem in autonomous
driving. The key challenges in prediction are accurately anticipating the
behavior of surrounding agents and understanding the scene context. To address
these problems, we propose LatentFormer, a transformer-based model for
predicting future vehicle trajectories. The proposed method leverages a novel
technique for modeling interactions among dynamic objects in the scene.
Contrary to many existing approaches which model cross-agent interactions
during the observation time, our method additionally exploits the future states
of the agents. This is accomplished using a hierarchical attention mechanism
where the evolving states of the agents autoregressively control the
contributions of past trajectories and scene encodings in the final prediction.
Furthermore, we propose a multi-resolution map encoding scheme that relies on a
vision transformer module to effectively capture both local and global scene
context to guide the generation of more admissible future trajectories. We
evaluate the proposed method on the nuScenes benchmark dataset and show that
our approach achieves state-of-the-art performance and improves upon trajectory
metrics by up to 40%. We further investigate the contributions of various
components of the proposed technique via extensive ablation studies.
- Abstract(参考訳): マルチエージェント軌道予測は自動運転の基本的な問題である。
予測における重要な課題は、周囲のエージェントの振る舞いを正確に予測し、シーンコンテキストを理解することである。
そこで本研究では, 将来の車両軌跡予測のためのトランスフォーマモデルである latentformer を提案する。
提案手法はシーン内の動的オブジェクト間の相互作用をモデル化する新しい手法を利用する。
観測時間中にクロスエージェント相互作用をモデル化する既存のアプローチとは対照的に、この手法はエージェントの将来状態も活用する。
これは、エージェントの進化状態が最終予測における過去の軌跡やシーンエンコーディングの貢献を自己回帰的に制御する階層的な注意機構を用いて達成される。
さらに,視覚トランスフォーマーモジュールを用いて,局所的および大域的なシーンコンテキストを効果的にキャプチャし,より許容可能な将来のトラジェクタ生成を導くマルチレゾリューションマップ符号化方式を提案する。
提案手法をnuscenesベンチマークデータセット上で評価し,提案手法が最先端性能を達成し,軌道指標を最大40%向上させることを示す。
さらに,広範囲なアブレーション研究を通じて,提案手法の各種成分の寄与について検討した。
関連論文リスト
- Enhanced Prediction of Multi-Agent Trajectories via Control Inference and State-Space Dynamics [14.694200929205975]
本稿では,状態空間動的システムモデリングに基づく軌道予測の新しい手法を提案する。
動的システムにおける状態推定の精度を高めるために,制御変数に対する新しいモデリング手法を提案する。
提案手法は,グラフニューラルネットワークと状態空間モデルを統合し,マルチエージェント相互作用の複雑さを効果的に捉える。
論文 参考訳(メタデータ) (2024-08-08T08:33:02Z) - Vectorized Representation Dreamer (VRD): Dreaming-Assisted Multi-Agent Motion-Forecasting [2.2020053359163305]
マルチエージェント動作予測問題に対するベクトル化された世界モデルに基づくアプローチであるVRDを紹介する。
本手法では,従来のオープンループトレーニングシステムと,新しい夢のクローズループトレーニングパイプラインを組み合わせる。
本モデルでは,1つの予測ミスレート測定値に対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-06-20T15:34:17Z) - Certified Human Trajectory Prediction [66.1736456453465]
交通予知は自動運転車に不可欠な役割を担っている。
本稿では,軌道予測作業に適した認証手法を提案する。
非有界出力や変異モダリティを含む、軌道予測に関連する固有の課題に対処する。
論文 参考訳(メタデータ) (2024-03-20T17:41:35Z) - Diffusion-Based Environment-Aware Trajectory Prediction [3.1406146587437904]
自動運転車の安全かつ効率的な運転には、交通参加者の将来の軌跡を予測する能力が不可欠である。
本稿では,多エージェント軌道予測のための拡散モデルを提案する。
このモデルは、交通参加者と環境の間の複雑な相互作用を捉え、データのマルチモーダルな性質を正確に学習することができる。
論文 参考訳(メタデータ) (2024-03-18T10:35:15Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - A Hierarchical Hybrid Learning Framework for Multi-agent Trajectory
Prediction [4.181632607997678]
深層学習(DL)と強化学習(RL)の階層的ハイブリッドフレームワークを提案する。
DLの段階では、トラフィックシーンは、トランスフォーマースタイルのGNNが異種相互作用を符号化するために採用される複数の中間スケールの異種グラフに分割される。
RLの段階では、DLの段階で予測される重要な将来点を利用して、交通シーンを局所的なサブシーンに分割する。
論文 参考訳(メタデータ) (2023-03-22T02:47:42Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - What-If Motion Prediction for Autonomous Driving [58.338520347197765]
生存可能なソリューションは、道路レーンのような静的な幾何学的文脈と、複数のアクターから生じる動的な社会的相互作用の両方を考慮しなければならない。
本稿では,解釈可能な幾何学的(アクター・レーン)と社会的(アクター・アクター)の関係を持つグラフに基づく注意的アプローチを提案する。
提案モデルでは,道路レーンやマルチアクターの相互作用を仮定的に,あるいは「何」かで予測できる。
論文 参考訳(メタデータ) (2020-08-24T17:49:30Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Robust Trajectory Forecasting for Multiple Intelligent Agents in Dynamic
Scene [11.91073327154494]
動的シーンにおける複数エージェントのロバストな軌道予測手法を提案する。
提案手法は予測精度の点で最先端の予測手法より優れている。
論文 参考訳(メタデータ) (2020-05-27T02:32:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。