論文の概要: A VideoMAE-v2 Approach to Zero-Shot Traffic Accident Anticipation
- arxiv url: http://arxiv.org/abs/2606.09542v1
- Date: Mon, 08 Jun 2026 14:25:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:07.258563
- Title: A VideoMAE-v2 Approach to Zero-Shot Traffic Accident Anticipation
- Title(参考訳): ゼロショット交通事故予測のためのビデオMAE-v2アプローチ
- Authors: Siyuan Li, Xiaoyang Bi, Mengshi Qi,
- Abstract要約: 本稿では,フレームレベルの時間的リスク推定タスクと,粗いラベル付き2値事故データセットとのギャップを埋める枠組みを提案する。
本手法は,2026年CVPR@AUTOPILOTゼロショット事故予測大会で2位となる。
- 参考スコア(独自算出の注目度): 20.309082260025992
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Traffic accident anticipation -- predicting the likelihood of an imminent collision at every frame of a dashcam video -- is safety-critical yet difficult to scale, because collecting in-domain annotated accident footage for every deployment scenario is prohibitively expensive. We study this task under a zero-shot setting where no target-domain training data is available: the model must learn exclusively from a publicly available binary-labelled driving-accident dataset and generalise to unseen dashcam footage. We propose a framework that bridges the gap between the frame-level temporal risk estimation task and coarsely labelled binary accident datasets by coupling a VideoMAE-v2 backbone with a per-frame prediction head under a sliding-window protocol. Our method achieves 2nd place in the 2026 CVPR@AUTOPILOT Zero-Shot Accident Anticipation competition. Code is available at https://github.com/TimeSouth/zero-shot-taa-solution.
- Abstract(参考訳): 交通事故の予測は、ダッシュカムのすべてのフレームで差し迫った衝突の可能性を予測している。
我々は、このタスクを、ターゲットドメインのトレーニングデータがないゼロショット環境で研究する。このモデルは、公開されているバイナリラベル付き駆動事故データセットからのみ学習し、目に見えないダッシュカムの映像に一般化する必要がある。
本稿では,ビデオMAE-v2バックボーンとフレーム単位の予測ヘッドをスライディングウインドウプロトコルで結合することにより,フレーム単位の時間的リスク推定タスクと粗いラベル付き2値事故データセットとのギャップを埋めるフレームワークを提案する。
本手法は,2026年CVPR@AUTOPILOTゼロショット事故予測大会で2位となる。
コードはhttps://github.com/TimeSouth/zero-shot-taa-solutionで入手できる。
関連論文リスト
- ACCIDENT: A Benchmark Dataset for Vehicle Accident Detection from Traffic Surveillance Videos [0.0]
ACCIDENTはCCTVの映像における交通事故検出のためのベンチマークデータセットである。
教師付き(IIDとOOD)およびゼロショット設定でモデルを評価するように設計されている。
論文 参考訳(メタデータ) (2026-04-10T18:51:19Z) - Accident Anticipation via Temporal Occurrence Prediction [15.813749445439292]
事故予測は、潜在的な衝突をオンラインで予測することを目的としており、タイムリーな警報によって道路の安全性を高めることができる。
既存の手法では、リスクの指標としてフレームレベルのリスクスコアを予測するのが一般的である。
本稿では,予測対象を現在のフレームリスクスコアから,将来の複数段階における事故スコアを直接推定するパラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-25T11:57:22Z) - EQ-TAA: Equivariant Traffic Accident Anticipation via Diffusion-Based Accident Video Synthesis [79.25588905883191]
交通現場における交通事故予測(TAA)は, 今後ゼロ死亡率を達成する上で, 課題となる。
本稿では,追加の事故ビデオクリップを合成するAVDモデルを提案する。
論文 参考訳(メタデータ) (2025-03-16T01:56:38Z) - DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文 参考訳(メタデータ) (2023-04-03T17:37:00Z) - Augmenting Ego-Vehicle for Traffic Near-Miss and Accident Classification
Dataset using Manipulating Conditional Style Translation [0.3441021278275805]
事故が起こる前の事故と近距離事故には差はない。
我々の貢献は、事故の定義を再定義し、DADA-2000データセットにおける事故の不整合を再注釈することである。
提案手法は、条件付きスタイル変換(CST)と分離可能な3次元畳み込みニューラルネットワーク(S3D)の2つの異なるコンポーネントを統合する。
論文 参考訳(メタデータ) (2023-01-06T22:04:47Z) - Cognitive Accident Prediction in Driving Scenes: A Multimodality
Benchmark [77.54411007883962]
本研究では,視覚的観察と運転者の注意に対する人為的な文章記述の認識を効果的に活用し,モデルトレーニングを容易にする認知事故予測手法を提案する。
CAPは、注意テキスト〜ビジョンシフト融合モジュール、注意シーンコンテキスト転送モジュール、運転注意誘導事故予測モジュールによって構成される。
我々は,1,727件の事故ビデオと219万フレーム以上の大規模ベンチマークを構築した。
論文 参考訳(メタデータ) (2022-12-19T11:43:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。