論文の概要: Sensing Anomalies like Humans: A Hominine Framework to Detect Abnormal
Events from Unlabeled Videos
- arxiv url: http://arxiv.org/abs/2108.01975v1
- Date: Wed, 4 Aug 2021 11:31:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-05 13:17:30.617850
- Title: Sensing Anomalies like Humans: A Hominine Framework to Detect Abnormal
Events from Unlabeled Videos
- Title(参考訳): 人間のような異常を検知する:未ラベルビデオから異常事象を検出するホミニンフレームワーク
- Authors: Siqi Wang, Guang Yu, Zhiping Cai, En Zhu, Xinwang Liu, Jianping Yin,
Chengzhang Zhu
- Abstract要約: ビデオ異常検出(VAD)は、ビデオ分析において常に重要なトピックである。
我々は、人間が異常を感知する方法にインスパイアされ、教師なしとエンドツーエンドの両方のVADを可能にするホミニンフレームワークを提案する。
- 参考スコア(独自算出の注目度): 48.15740415466055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video anomaly detection (VAD) has constantly been a vital topic in video
analysis. As anomalies are often rare, it is typically addressed under a
semi-supervised setup, which requires a training set with pure normal videos.
To avoid exhausted manual labeling, we are inspired by how humans sense
anomalies and propose a hominine framework that enables both unsupervised and
end-to-end VAD. The framework is based on two key observations: 1) Human
perception is usually local, i.e. focusing on local foreground and its context
when sensing anomalies. Thus, we propose to impose locality-awareness by
localizing foreground with generic knowledge, and a region localization
strategy is designed to exploit local context. 2) Frequently-occurred events
will mould humans' definition of normality, which motivates us to devise a
surrogate training paradigm. It trains a deep neural network (DNN) to learn a
surrogate task with unlabeled videos, and frequently-occurred events will play
a dominant role in "moulding" the DNN. In this way, a training loss gap will
automatically manifest rarely-seen novel events as anomalies. For
implementation, we explore various surrogate tasks as well as both classic and
emerging DNN models. Extensive evaluations on commonly-used VAD benchmarks
justify the framework's applicability to different surrogate tasks or DNN
models, and demonstrate its astonishing effectiveness: It not only outperforms
existing unsupervised solutions by a wide margin (8% to 10% AUROC gain), but
also achieves comparable or even superior performance to state-of-the-art
semi-supervised counterparts.
- Abstract(参考訳): ビデオ異常検出(VAD)は、ビデオ分析において常に重要なトピックである。
異常は稀であり、通常は半監督された設定で対処されるが、これは純粋な通常のビデオのトレーニングセットを必要とする。
手動ラベリングの浪費を避けるため、我々は人間が異常を感知する方法に触発され、教師なしとエンドツーエンドの両方のVODを可能にするホミニンフレームワークを提案する。
この枠組みは、2つの重要な観察に基づいている: 1) 人間の知覚は通常局所的、すなわち局所的である。
局所的な前景と、異常を感知する際のコンテキストに焦点を当てます。
そこで本研究では,前景を汎用知識でローカライズすることで,局所性意識を付加することを提案し,局所的文脈を活用するために地域的ローカライゼーション戦略を設計する。
2) 頻繁に発生する事象は, 人間の正規性の定義を形作り, 代理訓練パラダイムを考案する動機となる。
ディープニューラルネットワーク(DNN)をトレーニングして、ラベルのないビデオで代理的なタスクを学ぶ。
このように、トレーニング損失ギャップは、まれに見られる新しい事象を異常として自動的に現れる。
実装では,従来のDNNモデルと新しいDNNモデルの両方と同様に,様々なサロゲートタスクについて検討する。
一般的なVADベンチマークに対する広範囲な評価は、異なるサロゲートタスクやDNNモデルに対するフレームワークの適用性を正当化し、その驚くべき効果を証明している。
関連論文リスト
- Temporal Divide-and-Conquer Anomaly Actions Localization in Semi-Supervised Videos with Hierarchical Transformer [0.9208007322096532]
異常な行動の検出と位置決めは、セキュリティと高度な監視システムにおいて重要な役割を果たす。
本稿では,異常ビデオにおける観察行動の重要性を評価するために,階層型トランスフォーマーモデルを提案する。
本手法は, 親映像を階層的に複数の時間的児童事例に区分し, 親映像の異常の分類における子ノードの影響を計測する。
論文 参考訳(メタデータ) (2024-08-24T18:12:58Z) - Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.01985221057047]
本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-12T03:31:29Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - LGN-Net: Local-Global Normality Network for Video Anomaly Detection [9.578697308678153]
ビデオ検出(VAD)は、監視されていないインテリジェントなビデオシステムにおいて、その潜在的な応用について、長年にわたって集中的に研究されてきた。
既存のVAD手法は、通常のビデオのみからなるトレーニングセットから正規性を学ぶ傾向がある。
本稿では,局所正規度とグローバル正規度を同時に学習する2分岐モデル(LG-Net)を提案する。
論文 参考訳(メタデータ) (2022-11-14T15:32:08Z) - Detecting and Learning the Unknown in Semantic Segmentation [4.970364068620608]
セマンティックセグメンテーションは自動運転における認識にとって重要な要素である。
ディープニューラルネットワーク(DNN)はこのタスクに一般的に使われ、通常、クローズドオペレーショナルドメインに現れるオブジェクトクラスの閉じたセットでトレーニングされる。
本稿ではまず,情報理論の観点から異常について概説する。
セマンティックセグメンテーションにおける意味不明物体の検出に関する研究について概説する。
異常物体に対する高エントロピー応答の訓練は他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-17T15:07:24Z) - Anomaly Crossing: A New Method for Video Anomaly Detection as
Cross-domain Few-shot Learning [32.0713939637202]
ビデオ異常検出は、ビデオで発生した異常事象を特定することを目的としている。
従来のアプローチのほとんどは、教師なしまたは半教師なしの手法で通常のビデオからのみ学習する。
本稿では,ビデオの異常検出に通常のビデオと異常ビデオの両方をフル活用することで,新たな学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-12-12T20:49:38Z) - A Background-Agnostic Framework with Adversarial Training for Abnormal
Event Detection in Video [120.18562044084678]
近年,ビデオにおける異常事象検出は複雑なコンピュータビジョンの問題として注目されている。
通常のイベントのみを含むトレーニングビデオから学習するバックグラウンドに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-27T18:39:24Z) - Localizing Anomalies from Weakly-Labeled Videos [45.58643708315132]
Weakly Supervised Anomaly Localization (WSAL)法を提案する。
異常映像の出現差にインスパイアされ, 隣接する時間領域の進化を異常映像の局所化のために評価した。
提案手法は,UCF-CrimeおよびTADデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2020-08-20T12:58:03Z) - Self-trained Deep Ordinal Regression for End-to-End Video Anomaly
Detection [114.9714355807607]
ビデオ異常検出に自己学習深層順序回帰を適用することで,既存の手法の2つの重要な限界を克服できることを示す。
我々は,手動で正規/異常データをラベル付けすることなく,共同表現学習と異常スコアリングを可能にする,エンドツーエンドのトレーニング可能なビデオ異常検出手法を考案した。
論文 参考訳(メタデータ) (2020-03-15T08:44:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。