論文の概要: PreTR: Spatio-Temporal Non-Autoregressive Trajectory Prediction
Transformer
- arxiv url: http://arxiv.org/abs/2203.09293v1
- Date: Thu, 17 Mar 2022 12:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 14:07:25.896022
- Title: PreTR: Spatio-Temporal Non-Autoregressive Trajectory Prediction
Transformer
- Title(参考訳): pretr:時空間非自己回帰軌道予測トランスフォーマ
- Authors: Lina Achaji, Thierno Barry, Thibault Fouqueray, Julien Moreau,
Francois Aioun, Francois Charpillet
- Abstract要約: PRediction Transformer (PReTR) と呼ばれるモデルを導入し、時間分解型アテンションモジュールを用いてマルチエージェントシーンから特徴を抽出する。
これは、経験的により良い結果を持つ以前の研究されたモデルよりも計算上の必要性が低いことを示している。
我々は,学習対象クエリの集合を並列デコードするために,エンコーダ・デコーダ・トランスフォーマネットワークを利用する。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nowadays, our mobility systems are evolving into the era of intelligent
vehicles that aim to improve road safety. Due to their vulnerability,
pedestrians are the users who will benefit the most from these developments.
However, predicting their trajectory is one of the most challenging concerns.
Indeed, accurate prediction requires a good understanding of multi-agent
interactions that can be complex. Learning the underlying spatial and temporal
patterns caused by these interactions is even more of a competitive and open
problem that many researchers are tackling. In this paper, we introduce a model
called PRediction Transformer (PReTR) that extracts features from the
multi-agent scenes by employing a factorized spatio-temporal attention module.
It shows less computational needs than previously studied models with
empirically better results. Besides, previous works in motion prediction suffer
from the exposure bias problem caused by generating future sequences
conditioned on model prediction samples rather than ground-truth samples. In
order to go beyond the proposed solutions, we leverage encoder-decoder
Transformer networks for parallel decoding a set of learned object queries.
This non-autoregressive solution avoids the need for iterative conditioning and
arguably decreases training and testing computational time. We evaluate our
model on the ETH/UCY datasets, a publicly available benchmark for pedestrian
trajectory prediction. Finally, we justify our usage of the parallel decoding
technique by showing that the trajectory prediction task can be better solved
as a non-autoregressive task.
- Abstract(参考訳): 現在、私たちのモビリティシステムは、道路安全を改善するためのインテリジェントな車両の時代へと進化しています。
その脆弱性のため、歩行者はこれらの開発から最も恩恵を受けるであろうユーザーである。
しかし、軌道を予測することは最も難しい問題の一つだ。
実際、正確な予測には複雑なマルチエージェント相互作用を十分に理解する必要がある。
これらの相互作用によって引き起こされる空間的・時間的パターンを学習することは、多くの研究者が取り組んでいる競争的かつオープンな問題である。
本稿では,因子化時空間注意モジュールを用いて,マルチエージェントシーンから特徴を抽出する予測トランスフォーマ(pretr)モデルを提案する。
これは、経験的により良い結果を持つ以前の研究されたモデルよりも計算の必要性が低いことを示している。
さらに, 従来の動作予測では, 接地構造ではなく, モデル予測サンプルに条件付けされた将来のシーケンスを生成することで生じる露光バイアス問題に悩まされていた。
提案手法を超越するため,我々はエンコーダ・デコーダトランスフォーマネットワークを用いて,学習対象クエリの集合を並列にデコードする。
この非自己回帰的解は反復条件付けの必要を回避し、学習時間と試験時間を確実に減少させる。
ETH/UCYデータセットを用いて,歩行者軌跡予測のためのベンチマークを行った。
最後に、軌道予測タスクを非回帰タスクとしてよりよく解くことができることを示すことにより、並列復号手法の使用を正当化する。
関連論文リスト
- Predicting Long-horizon Futures by Conditioning on Geometry and Time [49.86180975196375]
我々は,過去を前提とした将来のセンサ観測の課題を探求する。
マルチモーダリティを扱える画像拡散モデルの大規模事前学習を活用する。
我々は、屋内と屋外のシーンにまたがる多様なビデオのセットについて、ビデオ予測のためのベンチマークを作成する。
論文 参考訳(メタデータ) (2024-04-17T16:56:31Z) - T4P: Test-Time Training of Trajectory Prediction via Masked Autoencoder and Actor-specific Token Memory [39.021321011792786]
軌道予測は、複数のアクター間の相互作用を考慮することを必要とする難しい問題である。
データ駆動型アプローチは、この複雑な問題に対処するために使われてきたが、テスト期間中に分散シフトの下では信頼性の低い予測に悩まされている。
本研究では,観測データから回帰損失を用いたオンライン学習手法を提案する。
提案手法は,予測精度と計算効率の両方の観点から,既存の最先端オンライン学習手法の性能を超越した手法である。
論文 参考訳(メタデータ) (2024-03-15T06:47:14Z) - Attention-aware Social Graph Transformer Networks for Stochastic Trajectory Prediction [16.55909815712467]
軌道予測は、自律運転やロボット工学など、様々なインテリジェントな技術の基本である。
現在の軌道予測研究は、複雑な社会的相互作用、高ダイナミクス、多モード性といった問題に直面している。
マルチモーダル軌道予測のためのアテンション対応ソーシャルグラフトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-26T04:24:01Z) - EANet: Expert Attention Network for Online Trajectory Prediction [5.600280639034753]
Expert Attention Networkは、軌道予測のための完全なオンライン学習フレームワークである。
我々は,ネットワーク層の深さの異なる重みを調整し,勾配問題によるモデル更新が遅いことを回避し,専門家の注意を喚起する。
さらに,シナリオ変化に敏感な短期動作トレンドカーネル関数を提案する。
論文 参考訳(メタデータ) (2023-09-11T07:09:40Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - Pedestrian Trajectory Prediction via Spatial Interaction Transformer
Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。
このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。
本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文 参考訳(メタデータ) (2021-12-13T13:08:04Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - Learning Sparse Interaction Graphs of Partially Observed Pedestrians for
Trajectory Prediction [0.3025231207150811]
マルチペデストリアン軌道予測は、非構造環境における群衆と相互作用する自律システムの必然的な安全要素である。
Gumbel Social Transformerを提案し、Edge Gumbel Selectorは、各ステップで部分的に観察された歩行者のスパースグラフをサンプリングする。
提案手法は,仮定によって生じる潜在的な問題を克服し,ベンチマーク評価における関連研究よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-07-15T00:45:11Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Injecting Knowledge in Data-driven Vehicle Trajectory Predictors [82.91398970736391]
車両軌道予測タスクは、一般的に知識駆動とデータ駆動の2つの視点から取り組まれている。
本稿では,これら2つの視点を効果的に結合する「現実的残留ブロック」 (RRB) の学習を提案する。
提案手法は,残留範囲を限定し,その不確実性を考慮した現実的な予測を行う。
論文 参考訳(メタデータ) (2021-03-08T16:03:09Z) - End-to-end Contextual Perception and Prediction with Interaction
Transformer [79.14001602890417]
我々は3次元物体の検出と将来の動きを自動運転の文脈で予測する問題に取り組む。
空間的・時間的依存関係を捉えるために,新しいトランスフォーマーアーキテクチャを用いたリカレントニューラルネットワークを提案する。
私たちのモデルはエンドツーエンドでトレーニングでき、リアルタイムで実行されます。
論文 参考訳(メタデータ) (2020-08-13T14:30:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。