論文の概要: FLaRA: Predicting Future Latent Representations for Accident Anticipation
- arxiv url: http://arxiv.org/abs/2606.14380v1
- Date: Fri, 12 Jun 2026 12:16:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.888015
- Title: FLaRA: Predicting Future Latent Representations for Accident Anticipation
- Title(参考訳): FLaRA:事故予測のための今後の潜在表現予測
- Authors: Lorenzo Caselli, Tomaso Trinci, Tommaso Bianconcini, Simone Magistri, Leonardo Taccari, Francesco Sambo, Andrew D. Bagdanov,
- Abstract要約: ダッシュカムビデオからの交通事故を予想することは、インテリジェント交通システムにおいて重要な課題である。
事故予知のための潜在表現を予測することで、このパラダイムをシフトさせる新しい予測アーキテクチャであるFLaRAを提案する。
提案手法は,現実的な早期警告機能を維持しつつ,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 15.994549120609358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anticipating traffic accidents from dashcam videos is a critical challenge in intelligent transportation systems. Existing methods typically map visual context directly to a collision probability without explicitly modeling the future evolution of the driving scene. In this paper we propose FLaRA (Predicting Future Latent Representations for Accident Anticipation), a novel predictive architecture that shifts this paradigm by forecasting future latent representations for accident anticipation. Building upon the Video Joint-Embedding Predictive Architecture (V-JEPA2), our model conditions a predictor network on observed context frames to predict the forthcoming latent features of the scene. A classifier then operates on these predicted future representations rather than only on past observations. To ensure these forecasts remain grounded in realistic future dynamics, we introduce a joint training objective that simultaneously optimizes an auxiliary feature-level reconstruction loss and a cross-entropy classification loss. Extensive evaluations on the Nexar dataset, alongside cross-domain validations on the DAD, DADA-2000, and DoTA benchmarks, demonstrate that our approach achieves state-of-the-art performance while maintaining realistic early warning capabilities.
- Abstract(参考訳): ダッシュカムビデオからの交通事故を予想することは、インテリジェント交通システムにおいて重要な課題である。
既存の手法は通常、運転シーンの将来の進化を明示的にモデル化することなく、視覚コンテキストを直接衝突確率にマッピングする。
本稿では,事故予知のための将来の潜伏表現を予測することによって,このパラダイムをシフトさせる新しい予測アーキテクチャであるFLaRAを提案する。
The Video Joint-Embedding Predictive Architecture (V-JEPA2) に基づいて、我々のモデルでは、観測されたコンテキストフレーム上の予測ネットワークを条件として、シーンの近未来的な特徴を予測する。
分類器は過去の観測だけでなく、これらの予測された将来の表現で機能する。
これらの予測が現実的な将来の力学の基盤となることを保証するため、補助的な特徴レベル再構築損失とクロスエントロピー分類損失を同時に最適化する共同学習目標を導入する。
DAD,DAD-2000,DoTAベンチマークのクロスドメイン検証とともに,Nexarデータセットの広範囲な評価を行い,本手法が早期警告機能を維持しつつ,最先端のパフォーマンスを実現することを示す。
関連論文リスト
- Representations Before Pixels: Semantics-Guided Hierarchical Video Prediction [12.661995278049764]
本稿では,階層型ビデオ予測フレームワークRe2Pixを紹介する。
予測は意味表現予測と表現誘導視覚合成の2つの段階に分けられる。
重要な課題は、トレーニング中に利用できる地道表現と推論で使用される予測表現との間の列車テストのミスマッチから生じる。
論文 参考訳(メタデータ) (2026-04-13T16:42:46Z) - Future-Aware End-to-End Driving: Bidirectional Modeling of Trajectory Planning and Scene Evolution [96.25314747309811]
将来的なシーンの進化と軌道計画を共同でモデル化する,新たなエンドツーエンドフレームワークであるSeerDriveを紹介する。
本手法はまず,周辺環境の動態を予測するために,将来の鳥眼ビュー(BEV)の表現を予測する。
2つの重要な要素がこれを可能にする:(1)予測されたBEV機能を軌道プランナーに注入する将来対応計画、(2)反復的なシーンモデリングと車両計画。
論文 参考訳(メタデータ) (2025-10-13T07:41:47Z) - Ego-centric Predictive Model Conditioned on Hand Trajectories [52.531681772560724]
自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文 参考訳(メタデータ) (2025-08-27T13:09:55Z) - Foresight in Motion: Reinforcing Trajectory Prediction with Reward Heuristics [34.570579623171476]
The First Reasoning, Then Forecasting”は、行動意図を軌道予測のための空間的ガイダンスとして明示的に組み込む戦略である。
本稿では,新しいクエリ中心の逆強化学習方式を基礎とした,解釈可能な報酬駆動型意図推論手法を提案する。
提案手法は軌道予測の信頼性を著しく向上させ,最先端手法と比較して高い競争性能を実現する。
論文 参考訳(メタデータ) (2025-07-16T09:46:17Z) - EP-Diffuser: An Efficient Diffusion Model for Traffic Scene Generation and Prediction via Polynomial Representations [1.9191778789375846]
本稿では,EP-Diffuserについて紹介する。EP-Diffuserはパラメータ効率のよい拡散型生成モデルで,交通シーンの進化過程の分布を推定する。
道路レイアウトとエージェント履歴に基づいて,本モデルは予測器として機能し,多種多様なシーン継続を生成する。
EP-Diffuserを2つのSotAモデルと比較し、Argoverse 2データセット上での予測の精度と妥当性を検証した。
論文 参考訳(メタデータ) (2025-04-07T18:45:49Z) - Predicting Future Occupancy Grids in Dynamic Environment with
Spatio-Temporal Learning [63.25627328308978]
本稿では,将来の占有予測を生成するための時間的予測ネットワークパイプラインを提案する。
現在のSOTAと比較して、我々の手法は3秒の長い水平線での占有を予測している。
我々は、さらなる研究を支援するために、nulisに基づくグリッド占有データセットを公開します。
論文 参考訳(メタデータ) (2022-05-06T13:45:32Z) - Self-Supervised Action-Space Prediction for Automated Driving [0.0]
本稿では,自動走行のための新しい学習型マルチモーダル軌道予測アーキテクチャを提案する。
学習問題を加速度と操舵角の空間に投入することにより、運動論的に実現可能な予測を実現する。
提案手法は,都市交差点とラウンドアバウトを含む実世界のデータセットを用いて評価する。
論文 参考訳(メタデータ) (2021-09-21T08:27:56Z) - What-If Motion Prediction for Autonomous Driving [58.338520347197765]
生存可能なソリューションは、道路レーンのような静的な幾何学的文脈と、複数のアクターから生じる動的な社会的相互作用の両方を考慮しなければならない。
本稿では,解釈可能な幾何学的(アクター・レーン)と社会的(アクター・アクター)の関係を持つグラフに基づく注意的アプローチを提案する。
提案モデルでは,道路レーンやマルチアクターの相互作用を仮定的に,あるいは「何」かで予測できる。
論文 参考訳(メタデータ) (2020-08-24T17:49:30Z) - Physically constrained short-term vehicle trajectory forecasting with
naive semantic maps [6.85316573653194]
本稿では,エージェントの一般的な動きだけでなく,意味地図から関連する道路特徴を抽出する学習モデルを提案する。
我々は,道路境界を考慮した将来の動きを予測できるだけでなく,当初の訓練よりも長い時間的地平線の軌道を効果的かつ正確に予測できることを示した。
論文 参考訳(メタデータ) (2020-06-09T09:52:44Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。