論文の概要: Dual Memory Units with Uncertainty Regulation for Weakly Supervised
Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2302.05160v1
- Date: Fri, 10 Feb 2023 10:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 16:02:38.536917
- Title: Dual Memory Units with Uncertainty Regulation for Weakly Supervised
Video Anomaly Detection
- Title(参考訳): 弱教師付きビデオ異常検出のための不確実性制御付きデュアルメモリユニット
- Authors: Hang Zhou, Junqing Yu, Wei Yang
- Abstract要約: ビデオとセグメントレベルのラベル指向の既存のアプローチは、主に異常データの表現の抽出に重点を置いている。
本研究では、正規データの表現と異常データの識別特徴の両方を学習するために、不確実性制御デュアルメモリユニット(UR-DMU)モデルを提案する。
我々の手法は、最先端の手法よりも大きなマージンで優れている。
- 参考スコア(独自算出の注目度): 15.991784541576788
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Learning discriminative features for effectively separating abnormal events
from normality is crucial for weakly supervised video anomaly detection
(WS-VAD) tasks. Existing approaches, both video and segment-level label
oriented, mainly focus on extracting representations for anomaly data while
neglecting the implication of normal data. We observe that such a scheme is
sub-optimal, i.e., for better distinguishing anomaly one needs to understand
what is a normal state, and may yield a higher false alarm rate. To address
this issue, we propose an Uncertainty Regulated Dual Memory Units (UR-DMU)
model to learn both the representations of normal data and discriminative
features of abnormal data. To be specific, inspired by the traditional global
and local structure on graph convolutional networks, we introduce a Global and
Local Multi-Head Self Attention (GL-MHSA) module for the Transformer network to
obtain more expressive embeddings for capturing associations in videos. Then,
we use two memory banks, one additional abnormal memory for tackling hard
samples, to store and separate abnormal and normal prototypes and maximize the
margins between the two representations. Finally, we propose an uncertainty
learning scheme to learn the normal data latent space, that is robust to noise
from camera switching, object changing, scene transforming, etc. Extensive
experiments on XD-Violence and UCF-Crime datasets demonstrate that our method
outperforms the state-of-the-art methods by a sizable margin.
- Abstract(参考訳): 異常事象を正規性から効果的に分離する学習の特徴は、弱教師付きビデオ異常検出(ws-vad)タスクにとって重要である。
ビデオとセグメントレベルのラベル指向の既存のアプローチは、通常データの含意を無視しながら、異常データの表現を抽出することに焦点を当てている。
このようなスキームが準最適であること、すなわち異常をよりよく区別するためには、正常な状態が何であるかを理解する必要があり、より高い誤報率をもたらす可能性がある。
この問題に対処するために,正規データの表現と異常データの識別特徴の両方を学習する不確実性制御デュアルメモリユニット(UR-DMU)モデルを提案する。
具体的には,グラフ畳み込みネットワークにおける従来のグローバル・ローカル構造に触発されて,トランスフォーマーネットワークのためのグローバル・ローカル・マルチヘッド・セルフ・アテンション(gl-mhsa)モジュールを導入し,ビデオの関連を捉えるための表現力の高い埋め込みを得る。
次に,2つのメモリバンク,さらに1つの異常なメモリをハードサンプルの処理に使用し,異常なプロトタイプと通常のプロトタイプを分離し,両表現間のマージンを最大化する。
最後に,カメラのスイッチング,オブジェクトの変更,シーンの変換などのノイズに対して頑健な,通常のデータ潜時空間を学習するための不確実性学習手法を提案する。
XD-ViolenceデータセットとUCF-Crimeデータセットの大規模な実験により、我々の手法が最先端の手法よりも大きなマージンで優れていることが示された。
関連論文リスト
- ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - USD: Unsupervised Soft Contrastive Learning for Fault Detection in Multivariate Time Series [6.055410677780381]
本研究では,データ拡張とソフトコントラスト学習の組み合わせを導入し,より正確に状態行動の多面的特性を捉えることを目的としている。
この二重戦略は、正常な状態と異常な状態を区別するモデルの能力を著しく向上させ、複数のデータセットと設定で障害検出性能が著しく向上する。
論文 参考訳(メタデータ) (2024-05-25T14:48:04Z) - DMAD: Dual Memory Bank for Real-World Anomaly Detection [90.97573828481832]
我々は、DMAD(Anomaly Detection)のための表現学習を強化したDual Memory Bankという新しいフレームワークを提案する。
DMADはデュアルメモリバンクを用いて特徴距離を計算し、正常パターンと異常パターンの間の特徴注意を計算している。
DMADをMVTec-ADおよびVisAデータセット上で評価した。
論文 参考訳(メタデータ) (2024-03-19T02:16:32Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Unsupervised Video Anomaly Detection with Diffusion Models Conditioned
on Compact Motion Representations [17.816344808780965]
教師なしビデオ異常検出(VAD)問題とは、ビデオ内の各フレームをラベルにアクセスすることなく正常または異常に分類することである。
提案手法は条件付き拡散モデルを用いて,事前学習したネットワークから入力データを抽出する。
提案手法は,データ駆動しきい値を用いて,異常事象の指標として高い再構成誤差を考慮している。
論文 参考訳(メタデータ) (2023-07-04T07:36:48Z) - Multi-level Memory-augmented Appearance-Motion Correspondence Framework
for Video Anomaly Detection [1.9511777443446219]
マルチレベルメモリ拡張外見対応フレームワークを提案する。
外観と動きの潜在的対応は、外見と動きのセマンティックスアライメントとセマンティックス代替トレーニングによって探索される。
我々のフレームワークは最先端の手法より優れており、UCSD Ped2、CUHK Avenue、ShanghaiTechのデータセットで99.6%、93.8%、76.3%のAUCを達成した。
論文 参考訳(メタデータ) (2023-03-09T08:43:06Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Adaptive Memory Networks with Self-supervised Learning for Unsupervised
Anomaly Detection [54.76993389109327]
教師なし異常検出は、通常のデータのみをトレーニングすることで、目に見えない異常を検出するモデルを構築することを目的としている。
本稿では,これらの課題に対処するために,自己教師付き学習(AMSL)を用いた適応記憶ネットワーク(Adaptive Memory Network)を提案する。
AMSLには、一般的な正規パターンを学ぶための自己教師付き学習モジュールと、リッチな特徴表現を学ぶための適応型メモリ融合モジュールが組み込まれている。
論文 参考訳(メタデータ) (2022-01-03T03:40:21Z) - Discriminative-Generative Dual Memory Video Anomaly Detection [81.09977516403411]
近年,ビデオ異常検出(VAD)には,トレーニングプロセス中に通常のデータに代えて,いくつかの異常を使おうと試みている。
本稿では,いくつかの異常を生かしてデータの不均衡を解決するために,識別生成型デュアルメモリ(dream)異常検出モデルを提案する。
論文 参考訳(メタデータ) (2021-04-29T15:49:01Z) - Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit
Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。
本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。
通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。
NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文 参考訳(メタデータ) (2020-10-15T05:02:02Z) - Learning Memory-guided Normality for Anomaly Detection [33.77435699029528]
本稿では,異常検出に対する教師なし学習手法を提案する。
また,メモリをトレーニングするための特徴量と分離性損失を新たに提示し,メモリアイテムの識別能力と通常のデータからの深い学習能力を高める。
論文 参考訳(メタデータ) (2020-03-30T05:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。