論文の概要: GTA-Crime: A Synthetic Dataset and Generation Framework for Fatal Violence Detection with Adversarial Snippet-Level Domain Adaptation
- arxiv url: http://arxiv.org/abs/2509.08232v1
- Date: Wed, 10 Sep 2025 02:12:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.291038
- Title: GTA-Crime: A Synthetic Dataset and Generation Framework for Fatal Violence Detection with Adversarial Snippet-Level Domain Adaptation
- Title(参考訳): GTA-Crime: 逆スニペットレベルドメイン適応を用いた致命的ビオレンス検出のための合成データセットと生成フレームワーク
- Authors: Seongho Kim, Sejong Ryu, Hyoukjun You, Je Hyeong Hong,
- Abstract要約: GTA-Crimeは、Grand Theft Auto 5 (GTA5) を用いた致命的なビデオ異常データセットと生成フレームワークである。
我々のデータセットは、CCTVマルチビューの視点から様々な状況下で捉えた、射撃や刺殺のような致命的な状況を含む。
このようなシナリオの希少性に対処するため、この種のビデオを生成するためのフレームワークもリリースしています。
- 参考スコア(独自算出の注目度): 6.958908965629697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in video anomaly detection (VAD) have enabled identification of various criminal activities in surveillance videos, but detecting fatal incidents such as shootings and stabbings remains difficult due to their rarity and ethical issues in data collection. Recognizing this limitation, we introduce GTA-Crime, a fatal video anomaly dataset and generation framework using Grand Theft Auto 5 (GTA5). Our dataset contains fatal situations such as shootings and stabbings, captured from CCTV multiview perspectives under diverse conditions including action types, weather, time of day, and viewpoints. To address the rarity of such scenarios, we also release a framework for generating these types of videos. Additionally, we propose a snippet-level domain adaptation strategy using Wasserstein adversarial training to bridge the gap between synthetic GTA-Crime features and real-world features like UCF-Crime. Experimental results validate our GTA-Crime dataset and demonstrate that incorporating GTA-Crime with our domain adaptation strategy consistently enhances real world fatal violence detection accuracy. Our dataset and the data generation framework are publicly available at https://github.com/ta-ho/GTA-Crime.
- Abstract(参考訳): ビデオ異常検出(VAD)の最近の進歩により、監視ビデオにおける様々な犯罪行為の特定が可能になっているが、射殺や刺殺などの致命的な事件の検出は、データ収集における希少性や倫理的問題により、依然として困難である。
この制限を認識し,Grand Theft Auto 5 (GTA5) を用いた致命的なビデオ異常データセットと生成フレームワークであるGTA-Crimeを紹介する。
本データセットは, 行動タイプ, 天候, 日時, 視点など多様な条件下で, CCTVマルチビューの視点から捉えた, 射撃や刺傷などの致命的な状況を含む。
このようなシナリオの希少性に対処するため、この種のビデオを生成するためのフレームワークもリリースしています。
さらに, 合成GTA-Crime特徴とUCF-Crimeのような実世界の特徴とのギャップを埋めるために, Wasserstein 対逆トレーニングを用いたスニペットレベルのドメイン適応戦略を提案する。
GTA-Crimeデータセットを検証し、ドメイン適応戦略にGTA-Crimeを組み込むことで、現実世界の致命的な暴力検出精度が一貫して向上することが実証された。
データセットとデータ生成フレームワークはhttps://github.com/ta-ho/GTA-Crime.comで公開されています。
関連論文リスト
- GV-VAD : Exploring Video Generation for Weakly-Supervised Video Anomaly Detection [6.09434007746295]
ビデオ異常検出(VAD)は、インテリジェント監視などの公共安全アプリケーションにおいて重要な役割を果たす。
本稿では, 意味制御可能な, 物理的に可視な合成ビデオを生成するために, 映像強化弱教師付きVADフレームワークを提案する。
提案するフレームワークは,UCF-Crimeデータセットの最先端手法より優れている。
論文 参考訳(メタデータ) (2025-08-01T04:42:40Z) - Towards Scalable Video Anomaly Retrieval: A Synthetic Video-Text Benchmark [26.948237287675116]
ビデオ異常検索は、自然言語クエリを用いてビデオ内の異常事象をローカライズし、公衆の安全を促進することを目的としている。
既存のデータセットは、現実世界の異常の長い尾の性質と、大規模な収集を妨げるプライバシーの制約によって、データの不足に悩まされている。
SVTA(Synthetic Video-Text Anomaly benchmark)は,クロスモーダルな異常検索のための大規模なデータセットである。
論文 参考訳(メタデータ) (2025-06-02T09:23:58Z) - CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graph
Diffusion [83.30168660888913]
シーングラフを対応する制御可能な3Dシーンに変換する完全生成モデルであるCommonScenesを提案する。
パイプラインは2つのブランチで構成されており、1つは変分オートエンコーダでシーン全体のレイアウトを予測し、もう1つは互換性のある形状を生成する。
生成されたシーンは、入力シーングラフを編集し、拡散モデルのノイズをサンプリングすることで操作することができる。
論文 参考訳(メタデータ) (2023-05-25T17:39:13Z) - CCTV-Gun: Benchmarking Handgun Detection in CCTV Images [59.24281591714385]
銃の暴力は重要なセキュリティ問題であり、コンピュータビジョンコミュニティが効果的な銃検出アルゴリズムを開発することが必須である。
実際のCCTV画像から銃を検出することは、未だに困難で未調査の課題である。
我々は,実世界のCCTV画像における拳銃検出の課題に対処するベンチマーク「textbfCCTV-Gun」を提案する。
論文 参考訳(メタデータ) (2023-03-19T16:17:35Z) - UAV-CROWD: Violent and non-violent crowd activity simulator from the
perspective of UAV [0.0]
空から見ると、暴力的で非暴力的な人間の活動を捉えているビデオデータセットは少ない。
本稿では,暴力的・非暴力的と分類できる,様々な活動に従事する群衆の合成画像を生成することのできる,新しいベースラインシミュレータを提案する。
我々のシミュレーターは大規模でランダムな都市環境を生成でき、中距離コンピュータ上では平均25フレーム/秒を維持できる。
論文 参考訳(メタデータ) (2022-08-13T18:28:37Z) - YouTube-GDD: A challenging gun detection dataset with rich contextual
information [5.956046069509441]
この研究は、YouTube Gun Detection dataset(YouTube-GDD)と呼ばれる新しい挑戦的なデータセットを提示している。
私たちのデータセットは、343の高精細度YouTubeビデオから収集され、5,000の精巧な画像が含まれており、そのうち16064の銃と9046の人が注釈付けされている。
銃検出のためのベースラインを構築するために,YouTube-GDD上でYOLOv5を評価し,関連する注釈情報の追加が銃検出に与える影響を解析した。
論文 参考訳(メタデータ) (2022-03-08T14:55:10Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。