論文の概要: EQ-TAA: Equivariant Traffic Accident Anticipation via Diffusion-Based Accident Video Synthesis
- arxiv url: http://arxiv.org/abs/2506.10002v1
- Date: Sun, 16 Mar 2025 01:56:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.428126
- Title: EQ-TAA: Equivariant Traffic Accident Anticipation via Diffusion-Based Accident Video Synthesis
- Title(参考訳): EQ-TAA:拡散に基づく事故ビデオ合成による等変交通事故予測
- Authors: Jianwu Fang, Lei-Lei Li, Zhedong Zheng, Hongkai Yu, Jianru Xue, Zhengguo Li, Tat-Seng Chua,
- Abstract要約: 交通現場における交通事故予測(TAA)は, 今後ゼロ死亡率を達成する上で, 課題となる。
本稿では,追加の事故ビデオクリップを合成するAVDモデルを提案する。
- 参考スコア(独自算出の注目度): 79.25588905883191
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic Accident Anticipation (TAA) in traffic scenes is a challenging problem for achieving zero fatalities in the future. Current approaches typically treat TAA as a supervised learning task needing the laborious annotation of accident occurrence duration. However, the inherent long-tailed, uncertain, and fast-evolving nature of traffic scenes has the problem that real causal parts of accidents are difficult to identify and are easily dominated by data bias, resulting in a background confounding issue. Thus, we propose an Attentive Video Diffusion (AVD) model that synthesizes additional accident video clips by generating the causal part in dashcam videos, i.e., from normal clips to accident clips. AVD aims to generate causal video frames based on accident or accident-free text prompts while preserving the style and content of frames for TAA after video generation. This approach can be trained using datasets collected from various driving scenes without any extra annotations. Additionally, AVD facilitates an Equivariant TAA (EQ-TAA) with an equivariant triple loss for an anchor accident-free video clip, along with the generated pair of contrastive pseudo-normal and pseudo-accident clips. Extensive experiments have been conducted to evaluate the performance of AVD and EQ-TAA, and competitive performance compared to state-of-the-art methods has been obtained.
- Abstract(参考訳): 交通現場における交通事故予測(TAA)は, 今後ゼロ死亡率を達成する上で, 課題となる。
現在のアプローチでは、TAAを事故発生時間の厳格な注釈を必要とする教師付き学習タスクとして扱うのが一般的である。
しかし、交通シーンの固有長尾、不確実、高速進化の性質は、事故の本当の因果部分が識別が困難であり、データの偏りによって容易に支配され、背景の曖昧な問題を引き起こす。
そこで本研究では,通常のビデオクリップから事故ビデオまで,ダッシュカムビデオの因果部分を生成することで,付加的な事故ビデオクリップを合成するAVDモデルを提案する。
AVDは、ビデオ生成後のTAA用フレームのスタイルと内容を保持しながら、事故や事故のないテキストプロンプトに基づいて因果ビデオフレームを生成することを目的としている。
このアプローチは、追加のアノテーションなしで、さまざまな駆動シーンから収集されたデータセットを使用してトレーニングすることができる。
さらに、AVDは、アンカー事故のないビデオクリップと、コントラストのある擬似正規クリップと擬似事故クリップのペアに対して、等変3重損失を伴う同変TAA(EQ-TAA)を促進する。
AVDとEQ-TAAの性能を評価するために大規模な実験が行われ、最先端の手法と比較して競争性能が向上した。
関連論文リスト
- AVD2: Accident Video Diffusion for Accident Video Description [11.221276595088215]
AVD2(Accident Video Diffusion for Accident Video Description)は,事故現場の理解を高める新しいフレームワークである。
このフレームワークは、自然言語の詳細な記述や推論と一致した事故ビデオを生成し、その結果、EMM-AUデータセットが生成される。
EMM-AUデータセットの統合は、自動メトリクスと人的評価の両方で最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2025-02-20T18:22:44Z) - Abductive Ego-View Accident Video Understanding for Safe Driving
Perception [75.60000661664556]
マルチモーダル・アクシデント・ビデオ理解のための新しいデータセットMM-AUを提案する。
MM-AUには1,727件の映像が収録されている。
安全運転認識のための誘導型事故映像理解フレームワーク(AdVersa-SD)を提案する。
論文 参考訳(メタデータ) (2024-03-01T10:42:52Z) - Towards Video Anomaly Retrieval from Video Anomaly Detection: New
Benchmarks and Model [70.97446870672069]
ビデオ異常検出(VAD)はその潜在的な応用により注目されている。
Video Anomaly Retrieval (VAR)は、関連のある動画をモダリティによって実用的に検索することを目的としている。
一般的な異常データセットの上に構築されたUCFCrime-ARとXD-Violenceの2つのベンチマークを示す。
論文 参考訳(メタデータ) (2023-07-24T06:22:37Z) - Augmenting Ego-Vehicle for Traffic Near-Miss and Accident Classification
Dataset using Manipulating Conditional Style Translation [0.3441021278275805]
事故が起こる前の事故と近距離事故には差はない。
我々の貢献は、事故の定義を再定義し、DADA-2000データセットにおける事故の不整合を再注釈することである。
提案手法は、条件付きスタイル変換(CST)と分離可能な3次元畳み込みニューラルネットワーク(S3D)の2つの異なるコンポーネントを統合する。
論文 参考訳(メタデータ) (2023-01-06T22:04:47Z) - Cognitive Accident Prediction in Driving Scenes: A Multimodality
Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。
CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。
我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文 参考訳(メタデータ) (2022-12-19T11:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。