論文の概要: Multimodal Motion Prediction with Stacked Transformers
- arxiv url: http://arxiv.org/abs/2103.11624v1
- Date: Mon, 22 Mar 2021 07:25:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:58:57.457906
- Title: Multimodal Motion Prediction with Stacked Transformers
- Title(参考訳): 積層トランスを用いたマルチモーダル動作予測
- Authors: Yicheng Liu, Jinghuai Zhang, Liangji Fang, Qinhong Jiang, Bolei Zhou
- Abstract要約: 我々はmmTransformerと呼ばれるマルチモーダル動作予測のための新しいトランスフォーマーフレームワークを提案する。
スタックドトランスフォーマーに基づく新しいネットワークアーキテクチャは、固定された独立した提案のセットで機能レベルでマルチモダリティをモデル化するように設計されている。
次に、生成した提案のマルチモーダリティを誘導するために、地域ベースのトレーニング戦略を開発する。
- 参考スコア(独自算出の注目度): 35.9674180611893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting multiple plausible future trajectories of the nearby vehicles is
crucial for the safety of autonomous driving. Recent motion prediction
approaches attempt to achieve such multimodal motion prediction by implicitly
regularizing the feature or explicitly generating multiple candidate proposals.
However, it remains challenging since the latent features may concentrate on
the most frequent mode of the data while the proposal-based methods depend
largely on the prior knowledge to generate and select the proposals. In this
work, we propose a novel transformer framework for multimodal motion
prediction, termed as mmTransformer. A novel network architecture based on
stacked transformers is designed to model the multimodality at feature level
with a set of fixed independent proposals. A region-based training strategy is
then developed to induce the multimodality of the generated proposals.
Experiments on Argoverse dataset show that the proposed model achieves the
state-of-the-art performance on motion prediction, substantially improving the
diversity and the accuracy of the predicted trajectories. Demo video and code
are available at https://decisionforce.github.io/mmTransformer.
- Abstract(参考訳): 自動走行の安全性には、近隣の車両の複数の将来的な軌道を予測することが不可欠である。
最近の動き予測手法は、特徴を暗黙的に正規化したり、複数の候補提案を明示的に生成することで、そのようなマルチモーダルな動き予測を実現する。
しかしながら,提案手法は提案手法の生成と選択に先立つ知識に大きく依存するのに対して,遅延機能はデータの最も頻繁なモードに集中する可能性があるため,依然として困難である。
本研究では,mmTransformerと呼ばれるマルチモーダル動作予測のためのトランスフォーマフレームワークを提案する。
スタックドトランスフォーマーに基づく新しいネットワークアーキテクチャは、固定された独立した提案のセットで機能レベルでマルチモダリティをモデル化するように設計されている。
次に、地域ベースのトレーニング戦略を開発し、生成された提案のマルチモーダリティを誘導する。
Argoverseデータセットの実験から,提案モデルが動作予測における最先端性能を実現し,予測された軌道の多様性と精度を大幅に向上させることが示された。
デモビデオとコードはhttps://decisionforce.github.io/mmtransformerで入手できる。
関連論文リスト
- Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文 参考訳(メタデータ) (2024-11-04T23:15:21Z) - MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and
Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。
本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。
最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。
複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文 参考訳(メタデータ) (2023-06-30T16:23:04Z) - Multimodal Manoeuvre and Trajectory Prediction for Automated Driving on
Highways Using Transformer Networks [5.571793666361683]
本稿では,複数の動作モードとその可能性を予測するための,新しいマルチモーダル予測フレームワークを提案する。
提案フレームワークは,マルチモーダルな操作および軌道予測のための調整されたトレーニング手法と,新しいトランスフォーマーに基づく予測モデルを含む。
その結果,我々のフレームワークは予測誤差の観点から,最先端のマルチモーダル手法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-28T16:25:16Z) - ProphNet: Efficient Agent-Centric Motion Forecasting with
Anchor-Informed Proposals [6.927103549481412]
モーション予測は自動運転システムにおいて重要なモジュールである。
マルチソース入力の不均一性、エージェント動作のマルチモーダリティ、オンボードデプロイメントに必要な低レイテンシのため、このタスクは極めて難しい。
本稿では,効率的なマルチモーダル動作予測のためのアンカー情報を用いたエージェント中心モデルを提案する。
論文 参考訳(メタデータ) (2023-03-21T17:58:28Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - STrajNet: Occupancy Flow Prediction via Multi-modal Swin Transformer [7.755385141347842]
本研究は,効率的なシーン占有とフロー予測のためのマルチモーダルSwinトランスフォーマーベースのフレームワークSTrajNetを提案する。
我々は,Swin Transformerを用いて画像とインタラクションを意識した動作表現を符号化し,グリッドセルに動き認識を注入するクロスアテンションモジュールを提案する。
フローと占有率の予測は、時間的共有ピラミッドデコーダによってデコードされる。
論文 参考訳(メタデータ) (2022-07-31T08:36:55Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - MultiXNet: Multiclass Multistage Multimodal Motion Prediction [27.046311751308775]
MultiXNetはライダーセンサデータに基づく検出と動作予測のためのエンドツーエンドのアプローチである。
本手法は,複数の都市でSDV群が収集した大規模実世界のデータを用いて評価した。
論文 参考訳(メタデータ) (2020-06-03T01:01:48Z) - TPNet: Trajectory Proposal Network for Motion Prediction [81.28716372763128]
Trajectory Proposal Network (TPNet) は、新しい2段階の動作予測フレームワークである。
TPNetはまず、仮説の提案として将来の軌道の候補セットを生成し、次に提案の分類と修正によって最終的な予測を行う。
4つの大規模軌道予測データセットの実験は、TPNetが定量的かつ定性的に、最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-04-26T00:01:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。