論文の概要: Surveillance Video-Based Traffic Accident Detection Using Transformer Architecture
- arxiv url: http://arxiv.org/abs/2512.11350v1
- Date: Fri, 12 Dec 2025 07:57:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.694291
- Title: Surveillance Video-Based Traffic Accident Detection Using Transformer Architecture
- Title(参考訳): トランスアーキテクチャを用いた監視ビデオによる交通事故検出
- Authors: Tanu Singh, Pranamesh Chakraborty, Long T. Truong,
- Abstract要約: 交通事故は、人口増加、都市化、自動車化による死亡率の増加により、世界的死亡率の主要な原因となっている。
事故検出のための伝統的なコンピュータ手法は、限られた理解と貧弱なクロスドメインの一般化を伴う。
本研究では,事前抽出した空間映像特徴を用いた変圧器アーキテクチャに基づく事故検出モデルを提案する。
- 参考スコア(独自算出の注目度): 2.621034368312571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Road traffic accidents represent a leading cause of mortality globally, with incidence rates rising due to increasing population, urbanization, and motorization. Rising accident rates raise concerns about traffic surveillance effectiveness. Traditional computer vision methods for accident detection struggle with limited spatiotemporal understanding and poor cross-domain generalization. Recent advances in transformer architectures excel at modeling global spatial-temporal dependencies and parallel computation. However, applying these models to automated traffic accident detection is limited by small, non-diverse datasets, hindering the development of robust, generalizable systems. To address this gap, we curated a comprehensive and balanced dataset that captures a wide spectrum of traffic environments, accident types, and contextual variations. Utilizing the curated dataset, we propose an accident detection model based on a transformer architecture using pre-extracted spatial video features. The architecture employs convolutional layers to extract local correlations across diverse patterns within a frame, while leveraging transformers to capture sequential-temporal dependencies among the retrieved features. Moreover, most existing studies neglect the integration of motion cues, which are essential for understanding dynamic scenes, especially during accidents. These approaches typically rely on static features or coarse temporal information. In this study, multiple methods for incorporating motion cues were evaluated to identify the most effective strategy. Among the tested input approaches, concatenating RGB features with optical flow achieved the highest accuracy at 88.3%. The results were further compared with vision language models (VLM) such as GPT, Gemini, and LLaVA-NeXT-Video to assess the effectiveness of the proposed method.
- Abstract(参考訳): 道路交通事故は、人口増加、都市化、自動車化などによって発生率が上昇し、世界的死亡率の主要な原因となっている。
事故率の上昇は交通監視の有効性への懸念を高める。
事故検出のための従来のコンピュータビジョン手法は、時空間的理解が限られ、ドメイン間の一般化が貧弱である。
変圧器アーキテクチャの最近の進歩は、大域的時空間依存性と並列計算のモデル化に優れている。
しかし、これらのモデルを自動交通事故検出に適用することは、小規模で多種多様なデータセットによって制限され、堅牢で一般化可能なシステムの開発を妨げる。
このギャップに対処するために、幅広いトラフィック環境、事故タイプ、コンテキスト変動をキャプチャする、包括的なバランスのとれたデータセットをキュレートしました。
得られたデータを用いて,事前抽出した空間映像特徴を用いたトランスフォーマアーキテクチャに基づく事故検出モデルを提案する。
このアーキテクチャでは、畳み込みレイヤを使用して、フレーム内のさまざまなパターンをまたいだ局所的相関を抽出し、トランスフォーマーを活用して、取得した特徴間のシーケンシャルな時間的依存関係をキャプチャする。
さらに、既存の研究の多くは、特に事故時の動的シーンを理解するのに欠かせないモーションキューの統合を無視している。
これらのアプローチは通常、静的な特徴や粗い時間的情報に依存します。
本研究では,動作手段を取り入れた複数の手法を評価し,最も効果的な戦略を同定した。
試験された入力手法の中で、RGBの特徴と光学的流れを結びつけることは88.3%の精度で達成された。
提案手法の有効性を評価するため, GPT, Gemini, LLaVA-NeXT-Video などの視覚言語モデル (VLM) と比較した。
関連論文リスト
- Graph Enhanced Trajectory Anomaly Detection [23.8160784400789]
軌道異常検出は、インテリジェント交通システムから都市安全・不正防止に至るまで、異常かつ予期せぬ動きパターンを特定するために不可欠である。
既存の手法では、軌跡をサンプリングされた位置の列として扱うことにより、軌道の性質とその運動空間の限られた側面しか考慮していない。
提案するグラフ拡張軌道異常検出フレームワークは,道路網のトポロジ,セグメントセマンティクス,過去の走行パターンを密に統合し,軌跡データをモデル化する。
論文 参考訳(メタデータ) (2025-09-22T20:15:15Z) - Urban Traffic Accident Risk Prediction Revisited: Regionality, Proximity, Similarity and Sparsity [18.566139471849844]
交通事故は人間の健康と財産の安全に重大な危険をもたらす。
交通事故を防ぐために、リスクを予測することで関心が高まっている。
望ましい予測ソリューションは、交通事故の複雑さに対するレジリエンスを示すべきである、と我々は主張する。
論文 参考訳(メタデータ) (2024-07-29T03:10:15Z) - CRASH: Crash Recognition and Anticipation System Harnessing with Context-Aware and Temporal Focus Attentions [13.981748780317329]
カメラ映像から周囲の交通機関の事故を正確にかつ迅速に予測することは、自動運転車(AV)の安全性に不可欠である
本研究は, CRASH と呼ばれる, AV の新たな事故予測フレームワークを提案する。
オブジェクト検出、特徴抽出、オブジェクト認識モジュール、コンテキスト認識モジュール、多層融合の5つのコンポーネントをシームレスに統合する。
私たちのモデルは、平均精度(AP)や平均到達時間(mTTA)といった重要な評価指標において、既存のトップベースラインを超えています。
論文 参考訳(メタデータ) (2024-07-25T04:12:49Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Real-Time Accident Detection in Traffic Surveillance Using Deep Learning [0.8808993671472349]
本稿では,交通監視用交差点における事故検出のための新しい効率的な枠組みを提案する。
提案手法は,最先端のYOLOv4法に基づく効率的かつ高精度な物体検出を含む,3つの階層的なステップから構成される。
提案フレームワークのロバスト性は,様々な照明条件でYouTubeから収集した映像シーケンスを用いて評価する。
論文 参考訳(メタデータ) (2022-08-12T19:07:20Z) - Spatial-Temporal Conv-sequence Learning with Accident Encoding for
Traffic Flow Prediction [17.94199362114272]
インテリジェント交通システムにおいて、交通予測の重要な問題は、周期的時間的依存関係と複雑な空間的相関を抽出する方法である。
本研究では、集中時間ブロックが一方向の畳み込みを用いて、短時間の時間的依存を効果的に捉えた時空間連続学習(STCL)を提案する。
本研究では,大規模実世界のタスクについて広範な実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-05-21T17:43:07Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。