論文の概要: Under the Hood of Transformer Networks for Trajectory Forecasting
- arxiv url: http://arxiv.org/abs/2203.11878v1
- Date: Tue, 22 Mar 2022 16:56:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 14:12:41.884375
- Title: Under the Hood of Transformer Networks for Trajectory Forecasting
- Title(参考訳): 軌道予測のための変圧器ネットワークのフッド下
- Authors: Luca Franco, Leonardo Placidi, Francesco Giuliari, Irtiza Hasan, Marco
Cristani, Fabio Galasso
- Abstract要約: Transformer Networksは、トラジェクティブ予測のためのデファクトステート・オブ・ザ・アートとして、自らを確立している。
本稿では,個人動作予測のためのトランスフォーマーネットワーク(TF)と双方向トランスフォーマー(BERT)の詳細な研究を提案する。
- 参考スコア(独自算出の注目度): 11.001055546731623
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer Networks have established themselves as the de-facto
state-of-the-art for trajectory forecasting but there is currently no
systematic study on their capability to model the motion patterns of people,
without interactions with other individuals nor the social context. This paper
proposes the first in-depth study of Transformer Networks (TF) and
Bidirectional Transformers (BERT) for the forecasting of the individual motion
of people, without bells and whistles. We conduct an exhaustive evaluation of
input/output representations, problem formulations and sequence modeling,
including a novel analysis of their capability to predict multi-modal futures.
Out of comparative evaluation on the ETH+UCY benchmark, both TF and BERT are
top performers in predicting individual motions, definitely overcoming RNNs and
LSTMs. Furthermore, they remain within a narrow margin wrt more complex
techniques, which include both social interactions and scene contexts. Source
code will be released for all conducted experiments.
- Abstract(参考訳): トランスフォーマー・ネットワークは、トラジェクティブ・予測のためのデファクト・ステート・オブ・ザ・アーティファクトとしての地位を確立してきたが、現在、他の個人や社会的文脈と相互作用することなく、人々の動作パターンをモデル化する能力について体系的な研究は行われていない。
本稿では,鐘や笛を使わずに個人の動きを予測するためのトランスフォーマーネットワーク(TF)と双方向トランスフォーマー(BERT)の詳細な研究を提案する。
入力/出力表現,問題定式化,シーケンスモデリングの徹底的な評価を行い,マルチモーダル未来を予測する能力の新しい分析を行った。
ETH+UCYベンチマークの比較評価のうち、TFとBERTはいずれも個々の動作を予測する上でトップパフォーマーであり、確実にRNNとLSTMに勝っている。
さらに、社会的相互作用とシーンコンテキストの両方を含む、より複雑なテクニックの狭い範囲に留まっている。
ソースコードはすべての実験のためにリリースされる。
関連論文リスト
- Multi-Transmotion: Pre-trained Model for Human Motion Prediction [68.87010221355223]
マルチトランスモーション(Multi-Transmotion)は、モダリティ事前トレーニング用に設計された革新的なトランスフォーマーベースのモデルである。
提案手法は,下流タスクにおける各種データセット間の競合性能を示す。
論文 参考訳(メタデータ) (2024-11-04T23:15:21Z) - Sparse Prototype Network for Explainable Pedestrian Behavior Prediction [60.80524827122901]
Sparse Prototype Network (SPN) は,歩行者の将来の行動,軌道,ポーズを同時に予測するための説明可能な手法である。
モノセマンティリティとクラスタリングの制約によって規則化されたプロトタイプは、一貫性と人間の理解可能な機能を学ぶ。
論文 参考訳(メタデータ) (2024-10-16T03:33:40Z) - In-Context Convergence of Transformers [63.04956160537308]
勾配降下法により訓練したソフトマックスアテンションを有する一層変圧器の学習力学について検討した。
不均衡な特徴を持つデータに対しては、学習力学が段階的に収束する過程をとることを示す。
論文 参考訳(メタデータ) (2023-10-08T17:55:33Z) - Optimizing Non-Autoregressive Transformers with Contrastive Learning [74.46714706658517]
非自己回帰変換器(NAT)は、逐次順序ではなく全ての単語を同時に予測することにより、自動回帰変換器(AT)の推論遅延を低減する。
本稿では,データ分布ではなく,モデル分布からのサンプリングによるモダリティ学習の容易化を提案する。
論文 参考訳(メタデータ) (2023-05-23T04:20:13Z) - Safety-compliant Generative Adversarial Networks for Human Trajectory
Forecasting [95.82600221180415]
群衆における人間予測は、社会的相互作用をモデル化し、衝突のないマルチモーダル分布を出力するという課題を提示する。
SGANv2は、動き時間相互作用モデリングと変圧器に基づく識別器設計を備えた安全に配慮したSGANアーキテクチャである。
論文 参考訳(メタデータ) (2022-09-25T15:18:56Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - SFMGNet: A Physics-based Neural Network To Predict Pedestrian
Trajectories [2.862893981836593]
本稿では,歩行者の軌跡を予測する物理に基づくニューラルネットワークを提案する。
我々は、現実的な予測、予測性能、および「解釈可能性」に関するモデルを定量的に質的に評価する。
最初の結果は、合成データセットでのみ訓練されたモデルであっても、最先端の精度よりも現実的で解釈可能な軌道を予測できることを示唆している。
論文 参考訳(メタデータ) (2022-02-06T14:58:09Z) - AC-VRNN: Attentive Conditional-VRNN for Multi-Future Trajectory
Prediction [30.61190086847564]
条件付き変動リカレントニューラルネットワーク(C-VRNN)に基づくマルチフューチャ軌道予測のための生成アーキテクチャを提案する。
ヒューマンインタラクションは、繰り返し推定のオンライン注意深い隠れ状態改善を可能にするグラフベースのアテンションメカニズムでモデル化される。
論文 参考訳(メタデータ) (2020-05-17T17:21:23Z) - Transformer Networks for Trajectory Forecasting [11.802437934289062]
本稿では,トランスフォーマーネットワークを用いた軌道予測手法を提案する。
これはLSTMの逐次ステップバイステップ処理からトランスフォーマーの唯一のアテンションベースのメモリ機構への根本的な切り替えである。
論文 参考訳(メタデータ) (2020-03-18T09:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。