論文の概要: Spatial and social situation-aware transformer-based trajectory prediction of autonomous systems
- arxiv url: http://arxiv.org/abs/2406.02767v1
- Date: Tue, 4 Jun 2024 20:36:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 22:47:37.802687
- Title: Spatial and social situation-aware transformer-based trajectory prediction of autonomous systems
- Title(参考訳): 空間的・社会的状況を考慮した変圧器を用いた自律システムの軌道予測
- Authors: Kathrin Donandt, Dirk Söffker,
- Abstract要約: エージェントの振る舞いを所定の状況で予測するには、時間内に適切に反応する必要がある。
近年,深層学習に基づくモデルが動き予測の主流となっている。
より長い予測地平線の場合、予測軌道の地平線からの偏差は、空間的・社会的に非依存なモデルに比べて低い。
- 参考スコア(独自算出の注目度): 2.498836880652668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous transportation systems such as road vehicles or vessels require the consideration of the static and dynamic environment to dislocate without collision. Anticipating the behavior of an agent in a given situation is required to adequately react to it in time. Developing deep learning-based models has become the dominant approach to motion prediction recently. The social environment is often considered through a CNN-LSTM-based sub-module processing a $\textit{social tensor}$ that includes information of the past trajectory of surrounding agents. For the proposed transformer-based trajectory prediction model, an alternative, computationally more efficient social tensor definition and processing is suggested. It considers the interdependencies between target and surrounding agents at each time step directly instead of relying on information of last hidden LSTM states of individually processed agents. A transformer-based sub-module, the Social Tensor Transformer, is integrated into the overall prediction model. It is responsible for enriching the target agent's dislocation features with social interaction information obtained from the social tensor. For the awareness of spatial limitations, dislocation features are defined in relation to the navigable area. This replaces additional, computationally expensive map processing sub-modules. An ablation study shows, that for longer prediction horizons, the deviation of the predicted trajectory from the ground truth is lower compared to a spatially and socially agnostic model. Even if the performance gain from a spatial-only to a spatial and social context-sensitive model is small in terms of common error measures, by visualizing the results it can be shown that the proposed model in fact is able to predict reactions to surrounding agents and explicitely allows an interpretable behavior.
- Abstract(参考訳): 自動車や船舶などの自律輸送システムでは、衝突せずに移動するために静的かつ動的環境を考慮する必要がある。
エージェントの振る舞いを所定の状況で予測するには、時間内に適切に反応する必要がある。
近年,深層学習に基づくモデル開発が,動き予測の主流となっている。
社会環境は、CNN-LSTMベースのサブモジュール処理により、周囲のエージェントの過去の軌跡の情報を含む$\textit{social tensor}$として考慮されることが多い。
提案した変圧器を用いた軌道予測モデルでは,より効率的なソーシャルテンソル定義と処理が提案されている。
個々の処理されたエージェントの最後に隠されたLSTM状態の情報に頼るのではなく、各時間におけるターゲットと周辺エージェント間の相互依存性を、直接的に考慮する。
トランスをベースとしたサブモジュールであるSocial Tensor Transformerは、全体的な予測モデルに統合される。
ターゲットエージェントの転位特徴をソーシャルテンソルから得られるソーシャルインタラクション情報で強化する役割を担っている。
空間的制限の認識のために、転位特徴は航行可能な領域に関連して定義される。
これは追加で計算コストのかかるマップ処理サブモジュールを置き換える。
アブレーション研究では、予測軌道の地平線が長くなると、予測軌道の地平線からの偏差は、空間的、社会的に不可知なモデルに比べて低いことが示されている。
空間限定モデルから空間的・社会的文脈依存モデルへの性能向上が, 共通誤差測定の観点からは小さいとしても, 結果を可視化することにより, 提案モデルが実際に周囲のエージェントに対する反応を予測でき, 解釈可能な振る舞いを明示できることを示すことができる。
関連論文リスト
- SocialFormer: Social Interaction Modeling with Edge-enhanced Heterogeneous Graph Transformers for Trajectory Prediction [3.733790302392792]
SocialFormerはエージェント間相互作用を意識した軌道予測手法である。
本稿では,エージェント動作の時間的社会的挙動をモデル化するために,ゲートリカレント単位(GRU)に基づくテンポラルエンコーダを提案する。
一般的なnuScenesベンチマークの軌道予測タスクとしてSocialFormerを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-05-06T19:47:23Z) - AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - STGlow: A Flow-based Generative Framework with Dual Graphormer for
Pedestrian Trajectory Prediction [22.553356096143734]
歩行者軌跡予測(STGlow)のための二重グラフマーを用いた新しい生成フローベースフレームワークを提案する。
本手法は,動作の正確なログライクな振る舞いを最適化することにより,基礎となるデータ分布をより正確にモデル化することができる。
いくつかのベンチマークによる実験結果から,本手法は従来の最先端手法に比べて性能が向上することが示された。
論文 参考訳(メタデータ) (2022-11-21T07:29:24Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Exploring Social Posterior Collapse in Variational Autoencoder for
Interaction Modeling [26.01824780050843]
変分オートエンコーダ(VAE)は多エージェント相互作用モデリングに広く応用されている。
VAEは、エージェントの将来の軌跡を予測する際に、歴史的社会的文脈を無視しやすい。
本稿では,ソーシャルな後部崩壊を検知する新しいスパースグラフアテンションメッセージパッシング層を提案する。
論文 参考訳(メタデータ) (2021-12-01T06:20:58Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - SGCN:Sparse Graph Convolution Network for Pedestrian Trajectory
Prediction [64.16212996247943]
歩行者軌道予測のためのスパースグラフ畳み込みネットワーク(SGCN)を提案する。
具体的には、SGCNはスパース指向の相互作用をスパース指向の空間グラフと明確にモデル化し、適応的な相互作用歩行者を捉える。
可視化は,歩行者の適応的相互作用とその運動特性を捉えることができることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:17:42Z) - Spatial-Channel Transformer Network for Trajectory Prediction on the
Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。
エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。
このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-01-27T15:03:42Z) - End-to-end Contextual Perception and Prediction with Interaction
Transformer [79.14001602890417]
我々は3次元物体の検出と将来の動きを自動運転の文脈で予測する問題に取り組む。
空間的・時間的依存関係を捉えるために,新しいトランスフォーマーアーキテクチャを用いたリカレントニューラルネットワークを提案する。
私たちのモデルはエンドツーエンドでトレーニングでき、リアルタイムで実行されます。
論文 参考訳(メタデータ) (2020-08-13T14:30:12Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - Social-WaGDAT: Interaction-aware Trajectory Prediction via Wasserstein
Graph Double-Attention Network [29.289670231364788]
本稿では,マルチエージェント軌道予測のためのジェネリック生成ニューラルシステムを提案する。
また、車両軌道予測に効率的なキネマティック拘束層を応用した。
提案システムは,軌道予測のための3つの公開ベンチマークデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-14T20:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。