論文の概要: ILNet: Trajectory Prediction with Inverse Learning Attention for Enhancing Intention Capture
- arxiv url: http://arxiv.org/abs/2507.06531v1
- Date: Wed, 09 Jul 2025 04:18:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.465447
- Title: ILNet: Trajectory Prediction with Inverse Learning Attention for Enhancing Intention Capture
- Title(参考訳): ILNet:意図獲得のための逆学習注意を用いた軌道予測
- Authors: Mingjin Zeng, Nan Ouyang, Wenkang Wan, Lei Ao, Qing Cai, Kai Sheng,
- Abstract要約: 人間のドライバーは、車両を取り巻く意図に関する仮定に基づいて、初期運転決定を動的に調整することが認められている。
Inverse Learning (IL) attentionとDynamic Anchor SelectionDAS (DAS) moduleを用いたマルチエージェント軌道予測手法であるILNetを提案する。
実験の結果,ILNet はInterAction と Argoverse の動作予測データセット上で,最先端の性能を達成していることがわかった。
- 参考スコア(独自算出の注目度): 4.190790144182306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory prediction for multi-agent interaction scenarios is a crucial challenge. Most advanced methods model agent interactions by efficiently factorized attention based on the temporal and agent axes. However, this static and foward modeling lacks explicit interactive spatio-temporal coordination, capturing only obvious and immediate behavioral intentions. Alternatively, the modern trajectory prediction framework refines the successive predictions by a fixed-anchor selection strategy, which is difficult to adapt in different future environments. It is acknowledged that human drivers dynamically adjust initial driving decisions based on further assumptions about the intentions of surrounding vehicles. Motivated by human driving behaviors, this paper proposes ILNet, a multi-agent trajectory prediction method with Inverse Learning (IL) attention and Dynamic Anchor Selection (DAS) module. IL Attention employs an inverse learning paradigm to model interactions at neighboring moments, introducing proposed intentions to dynamically encode the spatio-temporal coordination of interactions, thereby enhancing the model's ability to capture complex interaction patterns. Then, the learnable DAS module is proposed to extract multiple trajectory change keypoints as anchors in parallel with almost no increase in parameters. Experimental results show that the ILNet achieves state-of-the-art performance on the INTERACTION and Argoverse motion forecasting datasets. Particularly, in challenged interaction scenarios, ILNet achieves higher accuracy and more multimodal distributions of trajectories over fewer parameters. Our codes are available at https://github.com/mjZeng11/ILNet.
- Abstract(参考訳): マルチエージェントインタラクションシナリオの軌道予測は重要な課題である。
最も進んだ手法は、時間軸とエージェント軸に基づいて効率的に分解された注意によるエージェント相互作用をモデル化する。
しかし、この静的・フォワードモデリングは、明示的な対話的時空間調整を欠き、明白かつ即時的な行動意図のみを捉えている。
あるいは、現代の軌道予測フレームワークは、様々な将来の環境に適応することが難しい固定アンカー選択戦略によって、連続した予測を洗練させる。
人間のドライバーは、周囲の車両の意図に関するさらなる仮定に基づいて、初期運転決定を動的に調整することが認められている。
Inverse Learning (IL) attention と Dynamic Anchor Selection (DAS) module を用いたマルチエージェント軌道予測法である ILNet を提案する。
IL Attentionは、近隣の瞬間に相互作用をモデル化するための逆学習パラダイムを採用し、相互作用の時空間的調整を動的に符号化する意図を導入し、複雑な相互作用パターンをキャプチャするモデルの能力を向上する。
次に、学習可能なDASモジュールを提案し、パラメータがほとんど増加せずに並列に複数の軌道変更キーポイントをアンカーとして抽出する。
実験の結果,ILNet はInterAction と Argoverse の動作予測データセット上で最先端の性能を達成していることがわかった。
特に、課題のある相互作用のシナリオでは、ILNetはより精度が高く、より少ないパラメータのトラジェクトリのマルチモーダル分布を達成する。
私たちのコードはhttps://github.com/mjZeng11/ILNetで公開されています。
関連論文リスト
- AMP: Autoregressive Motion Prediction Revisited with Next Token Prediction for Autonomous Driving [59.94343412438211]
本稿では,GPT方式の次のトークン動作予測を動作予測に導入する。
同種単位-ワードからなる言語データとは異なり、運転シーンの要素は複雑な空間的・時間的・意味的な関係を持つ可能性がある。
そこで本稿では,情報集約と位置符号化スタイルの異なる3つの因子化アテンションモジュールを用いて,それらの関係を捉えることを提案する。
論文 参考訳(メタデータ) (2024-03-20T06:22:37Z) - Interpretable Long Term Waypoint-Based Trajectory Prediction Model [1.4778851751964937]
軌道予測フレームワークの性能に長期的目標を加えることが及ぼす影響について検討する。
We present a interpretable long term waypoint-driven prediction framework (WayDCM)。
論文 参考訳(メタデータ) (2023-12-11T09:10:22Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - A Hierarchical Hybrid Learning Framework for Multi-agent Trajectory
Prediction [4.181632607997678]
深層学習(DL)と強化学習(RL)の階層的ハイブリッドフレームワークを提案する。
DLの段階では、トラフィックシーンは、トランスフォーマースタイルのGNNが異種相互作用を符号化するために採用される複数の中間スケールの異種グラフに分割される。
RLの段階では、DLの段階で予測される重要な将来点を利用して、交通シーンを局所的なサブシーンに分割する。
論文 参考訳(メタデータ) (2023-03-22T02:47:42Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - Implicit Latent Variable Model for Scene-Consistent Motion Forecasting [78.74510891099395]
本稿では,センサデータから直接複雑な都市交通のシーン一貫性のある動き予測を学習することを目的とする。
我々は、シーンを相互作用グラフとしてモデル化し、強力なグラフニューラルネットワークを用いてシーンの分散潜在表現を学習する。
論文 参考訳(メタデータ) (2020-07-23T14:31:25Z) - Robust Trajectory Forecasting for Multiple Intelligent Agents in Dynamic
Scene [11.91073327154494]
動的シーンにおける複数エージェントのロバストな軌道予測手法を提案する。
提案手法は予測精度の点で最先端の予測手法より優れている。
論文 参考訳(メタデータ) (2020-05-27T02:32:55Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。