論文の概要: ESIA: An Energy-Based Spatiotemporal Interaction-Aware Framework for Pedestrian Intention Prediction
- arxiv url: http://arxiv.org/abs/2604.23728v1
- Date: Sun, 26 Apr 2026 14:13:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.523963
- Title: ESIA: An Energy-Based Spatiotemporal Interaction-Aware Framework for Pedestrian Intention Prediction
- Title(参考訳): ESIA: 歩行者の意図予測のための時空間相互作用認識フレームワーク
- Authors: Yanping Wu, Meiting Dang, Lin Wu, Edmond S. L. Ho, Zhenghua Chen, Chongfeng Wei,
- Abstract要約: 自動運転の最近の進歩は、歩行者の意図予測の研究を動機付けている。
既存の研究は、単純化されたマルチエージェント相互作用パターン、不透明な推論論理、グローバルな行動予測の欠如によって制約されている。
本研究では,歩行者と環境をノードとして扱うための条件ランダムフィールド(CRF)に基づくパラダイムを提案する。
- 参考スコア(独自算出の注目度): 24.45524909253344
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in autonomous driving have motivated research on pedestrian intention prediction, which aims to infer future crossing decisions and actions by modeling temporal dynamics, social interactions, and environmental context. However, existing studies remain constrained by oversimplified multi-agent interaction patterns, opaque reasoning logic, and a lack of global consistency in behavioral predictions, which compromise both robustness and interpretability. In this work, we propose ESIA (Energy-based Spatiotemporal Interaction-Aware framework), a novel Conditional Random Field (CRF)-based paradigm. We cast the intention prediction task as a structured prediction problem over a unified graph-based representation, treating pedestrians and the environment as spatiotemporal nodes. To characterize their distinct roles, we assign unary potentials to nodes to capture individual intentions, and pairwise potentials to edges to encode social and environmental interactions. These potentials are integrated into a unified global energy function to ensure scene-level consistency across behavioral predictions. To further constrain inference without ground-truth supervision, we introduce structural consistency terms to penalize logical contradictions. This optimization is efficiently solved via a novel Unary-Seeded Simulated Annealing (U-SSA) algorithm, which leverages high-confidence unary priors to rapidly converge to a high-quality solution. Extensive experiments on standard benchmarks demonstrate that ESIA achieves state-of-the-art performance with improved interpretability over existing methods.
- Abstract(参考訳): 自律運転の最近の進歩は、時間的ダイナミクス、社会的相互作用、環境コンテキストをモデル化することによって、将来の横断決定や行動を予測する歩行者意図予測の研究を動機付けている。
しかし、既存の研究は、過度に単純化されたマルチエージェントの相互作用パターン、不透明な推論論理、そして頑健さと解釈可能性の両方を損なう行動予測におけるグローバルな一貫性の欠如によって制約されている。
本研究では,新しい条件付きランダムフィールド(CRF)のパラダイムであるESIA(Energy-based Spatiotemporal Interaction-Aware framework)を提案する。
本研究では,歩行者と環境を時空間ノードとして扱うため,意図予測タスクをグラフベースの統一表現上の構造化予測問題として用いた。
それぞれの役割を特徴付けるために、ノードに単一ポテンシャルを割り当て、個々の意図を捉え、エッジにペアにポテンシャルを割り当て、社会的および環境的相互作用を符号化する。
これらのポテンシャルは、行動予測におけるシーンレベルの一貫性を確保するため、統一されたグローバルエネルギー関数に統合される。
地道な監督なしに推論をさらに制約するために、論理的矛盾を罰する構造的一貫性項を導入する。
この最適化は、高品質な解に迅速に収束するために、高信頼な単項前処理を利用する新しいUnary-Seeded Simulated Annealing (U-SSA)アルゴリズムによって効率よく解決される。
標準ベンチマークの大規模な実験は、ESIAが既存の手法よりも高い解釈性で最先端のパフォーマンスを達成することを実証している。
関連論文リスト
- Chatting about Conditional Trajectory Prediction [9.783060985404386]
条件付き軌道予測(CiT)のためのクロス時間領域意図対話法を提案する。
提案したCitは、時間とともに行動意図を共同で分析し、異なる時間領域における情報補完と統合を実現する。
さらに、CitTはロボットの動き計画と制御モジュールと密に統合し、任意の軌道予測結果を生成するように設計されている。
論文 参考訳(メタデータ) (2026-04-20T11:44:16Z) - Dynamic Attention (DynAttn): Interpretable High-Dimensional Spatio-Temporal Forecasting (with Application to Conflict Fatalities) [0.0]
DynAttnは高次元カウントプロセスのための解釈可能な動的アテンション予測フレームワークである。
透明な診断を維持しながら、予想される死傷率と超過率を多地点で予測する。
1ヶ月から12ヶ月の間、DynAttnはずっと高い予測精度を達成する。
論文 参考訳(メタデータ) (2025-12-24T21:47:35Z) - Tuning for Trustworthiness -- Balancing Performance and Explanation Consistency in Neural Network Optimization [49.567092222782435]
我々は,異なる特徴帰属法間の合意として定義された,XAI整合性という新しい概念を紹介する。
予測性能と説明のバランスをとる多目的最適化フレームワークを構築した。
本研究は、トレードオフゾーンバランス性能損失とXAI整合性による強靭性向上のモデルについて、今後の研究基盤を提供する。
論文 参考訳(メタデータ) (2025-05-12T13:19:14Z) - Topology-Aware Conformal Prediction for Stream Networks [68.02503121089633]
本研究では,ネットワークトポロジと時間的ダイナミクスを共形予測フレームワークに統合した新しいフレームワークであるspatio-Temporal Adaptive Conformal Inference (textttCISTA)を提案する。
この結果から,TextttCISTAは予測効率とカバレッジのバランスを効果的に保ち,既存のストリームネットワークの共形予測手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-03-06T21:21:15Z) - Neural Interaction Energy for Multi-Agent Trajectory Prediction [55.098754835213995]
ニューラル・インタラクション・エナジー(MATE)によるマルチエージェント軌道予測(Multi-Agent Trajectory Prediction)というフレームワークを導入する。
MATEは神経相互作用エネルギーを用いてエージェントの対話運動を評価する。
時間的安定性を高めるために,エージェント間相互作用制約とエージェント内動作制約という2つの制約を導入する。
論文 参考訳(メタデータ) (2024-04-25T12:47:47Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Prediction by Anticipation: An Action-Conditional Prediction Method
based on Interaction Learning [23.321627835039934]
潜在確率的生成過程の観点から相互作用を観察する予測による予測を提案する。
このビューでは、連続データフレームをアクション条件分布から順次サンプルに分解することができる。
提案する予測モデルである変分ベイズ型は,この条件分布のエビデンス下限 (elbo) を最大化するために訓練されている。
論文 参考訳(メタデータ) (2020-12-25T01:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。