論文の概要: VISTA: A Vision and Intent-Aware Social Attention Framework for Multi-Agent Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2511.10203v1
- Date: Fri, 14 Nov 2025 01:38:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.74326
- Title: VISTA: A Vision and Intent-Aware Social Attention Framework for Multi-Agent Trajectory Prediction
- Title(参考訳): VISTA:マルチエージェント軌道予測のための視覚的・意図的ソーシャルアテンションフレームワーク
- Authors: Stephane Da Silva Martins, Emanuel Aldea, Sylvie Le Hégarat-Mascle,
- Abstract要約: マルチエージェント軌道予測のための目標条件変換器 VISTA を提案する。
高密度のMADRASベンチマークでは、VISTAは最先端の精度を実現し、衝突は大幅に少ない。
これらの結果から, VISTAは社会的に適合し, 目標を意識し, 解釈可能な軌道を生成することがわかった。
- 参考スコア(独自算出の注目度): 4.4382802228131455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent trajectory prediction is crucial for autonomous systems operating in dense, interactive environments. Existing methods often fail to jointly capture agents' long-term goals and their fine-grained social interactions, which leads to unrealistic multi-agent futures. We propose VISTA, a recursive goal-conditioned transformer for multi-agent trajectory forecasting. VISTA combines (i) a cross-attention fusion module that integrates long-horizon intent with past motion, (ii) a social-token attention mechanism for flexible interaction modeling across agents, and (iii) pairwise attention maps that make social influence patterns interpretable at inference time. Our model turns single-agent goal-conditioned prediction into a coherent multi-agent forecasting framework. Beyond standard displacement metrics, we evaluate trajectory collision rates as a measure of joint realism. On the high-density MADRAS benchmark and on SDD, VISTA achieves state-of-the-art accuracy and substantially fewer collisions. On MADRAS, it reduces the average collision rate of strong baselines from 2.14 to 0.03 percent, and on SDD it attains zero collisions while improving ADE, FDE, and minFDE. These results show that VISTA generates socially compliant, goal-aware, and interpretable trajectories, making it promising for safety-critical autonomous systems.
- Abstract(参考訳): 密集した対話環境で動作する自律システムには,マルチエージェント軌道予測が不可欠である。
既存の方法は、エージェントの長期的な目標と、そのきめ細かい社会的相互作用を共同で捉えることに失敗し、非現実的なマルチエージェントの未来へと繋がる。
マルチエージェント軌道予測のための再帰的目標条件変換器 VISTA を提案する。
VISTAが組み合わさる
(i)長い水平方向と過去の動きを一体化する相互注意融合モジュール。
(二)エージェント間のフレキシブルインタラクションモデリングのための社会的注意機構、及び
三 推論時に社会的影響パターンを解釈する一対の注意図。
我々のモデルは、単一エージェントの目標条件予測をコヒーレントなマルチエージェント予測フレームワークに変換する。
標準変位測定の他に, 軌道衝突速度を共同現実感の尺度として評価する。
高密度のMADRASベンチマークとSDDでは、VISTAは最先端の精度を達成し、衝突を著しく少なくする。
MADRASでは、強いベースラインの平均衝突速度を2.14から0.03%に下げ、SDDではADE、FDE、minFDEを改善しながらゼロ衝突を達成する。
これらの結果は、VISTAが社会的に適合し、ゴール認識し、解釈可能な軌道を生成し、安全クリティカルな自律システムに期待できることを示している。
関連論文リスト
- ILNet: Trajectory Prediction with Inverse Learning Attention for Enhancing Intention Capture [4.190790144182306]
人間のドライバーは、車両を取り巻く意図に関する仮定に基づいて、初期運転決定を動的に調整することが認められている。
Inverse Learning (IL) attentionとDynamic Anchor SelectionDAS (DAS) moduleを用いたマルチエージェント軌道予測手法であるILNetを提案する。
実験の結果,ILNet はInterAction と Argoverse の動作予測データセット上で,最先端の性能を達成していることがわかった。
論文 参考訳(メタデータ) (2025-07-09T04:18:01Z) - SocialMOIF: Multi-Order Intention Fusion for Pedestrian Trajectory Prediction [21.780343024406285]
SocialMOIFはこれらの課題に対処するために提案されており、近隣グループ間の高次の意図的相互作用に集中している。
SocialMOIF内では、軌道分布近似器が軌道を実際のデータとより密に整合する値へと導くように設計されている。
より正確で効率的な並列予測を可能にするために、グローバルな軌道が導入された。
論文 参考訳(メタデータ) (2025-04-22T06:14:49Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - JFP: Joint Future Prediction with Interactive Multi-Agent Modeling for
Autonomous Driving [12.460224193998362]
構造化されたグラフィカルモデルの定式化において,エージェント同士の相互作用を直接学習するエンド・ツー・エンドのトレーニング可能なモデルを提案する。
提案手法は,単エージェントトラジェクタのトラジェクタとトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタのトラジェクタの性能を向上する。
論文 参考訳(メタデータ) (2022-12-16T20:59:21Z) - Safety-compliant Generative Adversarial Networks for Human Trajectory
Forecasting [95.82600221180415]
群衆における人間予測は、社会的相互作用をモデル化し、衝突のないマルチモーダル分布を出力するという課題を提示する。
SGANv2は、動き時間相互作用モデリングと変圧器に基づく識別器設計を備えた安全に配慮したSGANアーキテクチャである。
論文 参考訳(メタデータ) (2022-09-25T15:18:56Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - Spatio-Temporal Graph Dual-Attention Network for Multi-Agent Prediction
and Tracking [23.608125748229174]
異種エージェントを含む多エージェント軌道予測のための汎用生成ニューラルシステムを提案する。
提案システムは, 軌道予測のための3つのベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-02-18T02:25:35Z) - What-If Motion Prediction for Autonomous Driving [58.338520347197765]
生存可能なソリューションは、道路レーンのような静的な幾何学的文脈と、複数のアクターから生じる動的な社会的相互作用の両方を考慮しなければならない。
本稿では,解釈可能な幾何学的(アクター・レーン)と社会的(アクター・アクター)の関係を持つグラフに基づく注意的アプローチを提案する。
提案モデルでは,道路レーンやマルチアクターの相互作用を仮定的に,あるいは「何」かで予測できる。
論文 参考訳(メタデータ) (2020-08-24T17:49:30Z) - Traffic Agent Trajectory Prediction Using Social Convolution and
Attention Mechanism [57.68557165836806]
本稿では,自律走行車周辺における標的エージェントの軌道予測モデルを提案する。
対象エージェントの履歴トラジェクトリをアテンションマスクとしてエンコードし、ターゲットエージェントとその周辺エージェント間の対話関係をエンコードするソーシャルマップを構築する。
提案手法の有効性を検証するため,提案手法を公開データセット上の複数の手法と比較し,20%の誤差低減を実現した。
論文 参考訳(メタデータ) (2020-07-06T03:48:08Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z) - Social-WaGDAT: Interaction-aware Trajectory Prediction via Wasserstein
Graph Double-Attention Network [29.289670231364788]
本稿では,マルチエージェント軌道予測のためのジェネリック生成ニューラルシステムを提案する。
また、車両軌道予測に効率的なキネマティック拘束層を応用した。
提案システムは,軌道予測のための3つの公開ベンチマークデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-14T20:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。