論文の概要: Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory
Prediction
- arxiv url: http://arxiv.org/abs/2005.08514v2
- Date: Fri, 24 Jul 2020 03:32:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 23:21:48.636003
- Title: Spatio-Temporal Graph Transformer Networks for Pedestrian Trajectory
Prediction
- Title(参考訳): 歩行者軌跡予測のための時空間グラフトランスフォーマネットワーク
- Authors: Cunjun Yu, Xiao Ma, Jiawei Ren, Haiyu Zhao, Shuai Yi
- Abstract要約: 本稿では, 軌跡予測に注意機構のみを応用した, 時空間型graAph tRansフレームワークSTARを提案する。
この結果から,STARは5つの現実世界の歩行者予測データセット上で最先端の性能を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 29.602903750712713
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding crowd motion dynamics is critical to real-world applications,
e.g., surveillance systems and autonomous driving. This is challenging because
it requires effectively modeling the socially aware crowd spatial interaction
and complex temporal dependencies. We believe attention is the most important
factor for trajectory prediction. In this paper, we present STAR, a
Spatio-Temporal grAph tRansformer framework, which tackles trajectory
prediction by only attention mechanisms. STAR models intra-graph crowd
interaction by TGConv, a novel Transformer-based graph convolution mechanism.
The inter-graph temporal dependencies are modeled by separate temporal
Transformers. STAR captures complex spatio-temporal interactions by
interleaving between spatial and temporal Transformers. To calibrate the
temporal prediction for the long-lasting effect of disappeared pedestrians, we
introduce a read-writable external memory module, consistently being updated by
the temporal Transformer. We show that with only attention mechanism, STAR
achieves state-of-the-art performance on 5 commonly used real-world pedestrian
prediction datasets.
- Abstract(参考訳): 群衆の動きのダイナミクスを理解することは、例えば監視システムや自動運転など、現実世界の応用には不可欠である。
これは、社会的に認識された群衆空間相互作用と複雑な時間的依存関係を効果的にモデル化する必要があるためである。
軌道予測の最も重要な要因は注意力である。
本稿では,注意機構のみによる軌跡予測に対処する,時空間型graAph tRansformerフレームワークSTARを提案する。
STARは、新しいトランスフォーマーベースのグラフ畳み込み機構であるTGConvによるグラフ内群衆相互作用をモデル化する。
グラフ間の時間依存は、別々の時間変換器によってモデル化される。
STARは空間変換器と時間変換器の相互結合によって複雑な時空間相互作用をキャプチャする。
失明した歩行者の長期的効果の時間的予測を校正するために,時間的トランスフォーマーによって常に更新される読み書き可能な外部メモリモジュールを導入する。
注意機構のみを用いて、STARは5つの現実世界の歩行者予測データセット上で最先端のパフォーマンスを達成することを示す。
関連論文リスト
- AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - Triplet Attention Transformer for Spatiotemporal Predictive Learning [9.059462850026216]
本稿では,フレーム間動的特徴とフレーム内静的特徴の両方を捉えるために,革新的な三重項注意変換器を提案する。
このモデルはトリプレット・アテンション・モジュール(TAM)を組み込んだもので、時間、空間、チャネル次元における自己アテンションのメカニズムを探求することで、従来のリカレント・ユニットを置き換える。
論文 参考訳(メタデータ) (2023-10-28T12:49:33Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - SPOTR: Spatio-temporal Pose Transformers for Human Motion Prediction [12.248428883804763]
3次元人間の動き予測は、コンピュータビジョンにおける高い重要性と課題を計算した研究領域である。
伝統的に、自己回帰モデルは人間の動きを予測するために用いられてきた。
人間の動作予測のための非自己回帰モデルを提案する。
論文 参考訳(メタデータ) (2023-03-11T01:44:29Z) - Adaptive Graph Spatial-Temporal Transformer Network for Traffic Flow
Forecasting [6.867331860819595]
複雑な時空間相関と非線形トラフィックパターンのため、交通予測は非常に困難である。
既存の研究は主に、空間的相関と時間的相関を別々に考慮して、そのような空間的・時間的依存関係をモデル化する。
本稿では,局所的マルチヘッド自己アテンションを用いた空間時間グラフ上での空間空間的・時間的相関を直接モデル化する。
論文 参考訳(メタデータ) (2022-07-09T19:21:00Z) - Interaction Transformer for Human Reaction Generation [61.22481606720487]
本稿では,時間的,空間的両方の注意を持つトランスフォーマーネットワークからなる対話型トランスフォーマー(InterFormer)を提案する。
我々の手法は一般的であり、より複雑で長期的な相互作用を生成するのに利用できる。
論文 参考訳(メタデータ) (2022-07-04T19:30:41Z) - Autoformer: Decomposition Transformers with Auto-Correlation for
Long-Term Series Forecasting [68.86835407617778]
Autoformerは、Auto-Correlation機構を備えた、新しい分解アーキテクチャである。
長期的な予測では、Autoformerは6つのベンチマークで相対的に改善され、最先端の精度が得られる。
論文 参考訳(メタデータ) (2021-06-24T13:43:43Z) - Spatial-Channel Transformer Network for Trajectory Prediction on the
Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。
エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。
このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-01-27T15:03:42Z) - End-to-end Contextual Perception and Prediction with Interaction
Transformer [79.14001602890417]
我々は3次元物体の検出と将来の動きを自動運転の文脈で予測する問題に取り組む。
空間的・時間的依存関係を捉えるために,新しいトランスフォーマーアーキテクチャを用いたリカレントニューラルネットワークを提案する。
私たちのモデルはエンドツーエンドでトレーニングでき、リアルタイムで実行されます。
論文 参考訳(メタデータ) (2020-08-13T14:30:12Z) - A Spatio-temporal Transformer for 3D Human Motion Prediction [39.31212055504893]
本研究では,3次元人間の動きの生成モデル作成作業のためのトランスフォーマーに基づくアーキテクチャを提案する。
実験により,これが基礎となる運動力学を効果的に学習し,自己回帰モデルで観測される時間経過に伴う誤差の蓄積を低減することを示した。
論文 参考訳(メタデータ) (2020-04-18T19:49:28Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。