論文の概要: MLE-UVAD: Minimal Latent Entropy Autoencoder for Fully Unsupervised Video Anomaly Detection
- arxiv url: http://arxiv.org/abs/2603.23868v1
- Date: Wed, 25 Mar 2026 02:51:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.100374
- Title: MLE-UVAD: Minimal Latent Entropy Autoencoder for Fully Unsupervised Video Anomaly Detection
- Title(参考訳): MLE-UVAD:完全教師なしビデオ異常検出のための最小遅延エントロピーオートエンコーダ
- Authors: Yuang Geng, Junkai Zhou, Kang Yang, Pan He, Zhuoyang Zhou, Jose C. Principe, Joel Harley, Ivan Ruchkin,
- Abstract要約: 本稿では,再構成誤りにより異常を検出するエントロピー誘導型オートエンコーダを提案する。
鍵となるアイデアは、オートエンコーダにおける標準的な再構築損失と、新しい最小遅延エントロピー損失とを組み合わせることである。
本手法はベースラインよりも頑健で優れた性能を実現する。
- 参考スコア(独自算出の注目度): 7.322185733864892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the challenging problem of single-scene, fully unsupervised video anomaly detection (VAD), where raw videos containing both normal and abnormal events are used directly for training and testing without any labels. This differs sharply from prior work that either requires extensive labeling (fully or weakly supervised) or depends on normal-only videos (one-class classification), which are vulnerable to distribution shifts and contamination. We propose an entropy-guided autoencoder that detects anomalies through reconstruction error by reconstructing normal frames well while making anomalies reconstruct poorly. The key idea is to combine the standard reconstruction loss with a novel Minimal Latent Entropy (MLE) loss in the autoencoder. Reconstruction loss alone maps normal and abnormal inputs to distinct latent clusters due to their inherent differences, but also risks reconstructing anomalies too well to detect. Therefore, MLE loss addresses this by minimizing the entropy of latent embeddings, encouraging them to concentrate around high-density regions. Since normal frames dominate the raw video, sparse anomalous embeddings are pulled into the normal cluster, so the decoder emphasizes normal patterns and produces poor reconstructions for anomalies. This dual-loss design produces a clear reconstruction gap that enables effective anomaly detection. Extensive experiments on two widely used benchmarks and a challenging self-collected driving dataset demonstrate that our method achieves robust and superior performance over baselines.
- Abstract(参考訳): 本稿では,通常イベントと異常イベントの両方を含む生ビデオが,ラベルなしで直接トレーニングやテストに使用される,単一シーン完全教師なしビデオ異常検出(VAD)の課題に対処する。
これは、広範囲なラベリング(完全にまたは弱く監督される)を必要とする以前の作業とは大きく異なり、また、分散シフトや汚染に弱い通常のビデオ(一級分類)に依存している。
本稿では,正常なフレームをよく再構成し,異常を検出できるエントロピー誘導型オートエンコーダを提案する。
鍵となる考え方は、オートエンコーダにおける標準的な再構成損失と、新しい最小遅延エントロピー(MLE)損失とを組み合わせることである。
レコンストラクション損失は、通常と異常な入力を、固有の相違により異なる潜在クラスタにマッピングするだけでなく、異常を検出できないように再構築するリスクも負う。
したがって、MLE損失は、潜伏埋め込みのエントロピーを最小化し、高密度領域に集中させることによってこの問題に対処する。
通常のフレームが生のビデオを支配しているため、スパースな異常な埋め込みが通常のクラスタに引き込まれるため、デコーダは通常のパターンを強調し、異常の復元を貧弱にする。
この二重損失設計は、効果的な異常検出を可能にする明確な再構成ギャップを生じる。
広範に使用されている2つのベンチマークと、挑戦的な自己コンパイル型駆動データセットに関する大規模な実験により、本手法がベースラインよりも堅牢で優れた性能を達成することを示す。
関連論文リスト
- Collaborative Reconstruction and Repair for Multi-class Industrial Anomaly Detection [37.057760207060554]
コラボレーティブ・リコンストラクション・アンド・リコンストラクション(CRR)は、リコンストラクションを修復に変換する。
我々は,デコーダからの表現が十分なローカル情報を含むことを保証するために,特徴レベルのランダムマスキングを実装した。
我々は,合成異常マスクによって教師されるセグメンテーションネットワークを訓練し,ローカライゼーション性能を向上させる。
論文 参考訳(メタデータ) (2025-12-12T09:24:23Z) - Learning to Detect Multi-class Anomalies with Just One Normal Image Prompt [4.887838886202545]
通常の特徴を再構成し,ただ1つの正常画像プロンプト(OneNIP)で異常特徴を復元する,シンプルで効果的な手法を提案する。
以前の研究とは対照的に、OneNIPは1つの通常の画像プロンプトで初めて異常を再構築または復元し、統一された異常検出性能を効果的に向上させる。
OneNIPは、MVTec、BTAD、VisAの3つの業界異常検出ベンチマークにおいて、以前の方法よりも優れている。
論文 参考訳(メタデータ) (2025-05-14T10:25:14Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - Synthetic Pseudo Anomalies for Unsupervised Video Anomaly Detection: A
Simple yet Efficient Framework based on Masked Autoencoder [1.9511777443446219]
本稿では,ビデオ異常検出のための簡易かつ効率的なフレームワークを提案する。
擬似異常サンプルは、余分なデータ処理をせずにランダムマスクトークンを埋め込み、正規データのみから合成する。
また、正規性とそれに対応する擬似異常データから正規知識をよりよく学習するよう、AEsに促す正規性整合性訓練戦略を提案する。
論文 参考訳(メタデータ) (2023-03-09T08:33:38Z) - Two-stream Decoder Feature Normality Estimating Network for Industrial
Anomaly Detection [4.772323272202286]
正常な特徴と異常な特徴の両方を学習するための2ストリームデコーダネットワーク(TSDN)を提案する。
また、異常な特徴を排除し、異常領域の高品質な再構成を防止するための特徴正規度推定器(FNE)を提案する。
論文 参考訳(メタデータ) (2023-02-20T06:46:09Z) - Making Reconstruction-based Method Great Again for Video Anomaly
Detection [64.19326819088563]
ビデオの異常検出は重要な問題だが、難しい問題だ。
既存の再構成に基づく手法は、昔ながらの畳み込みオートエンコーダに依存している。
連続フレーム再構築のための新しいオートエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2023-01-28T01:57:57Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Unsupervised Video Anomaly Detection via Normalizing Flows with Implicit
Latent Features [8.407188666535506]
既存のほとんどのメソッドはオートエンコーダを使用して、通常のビデオの再構築を学ぶ。
本稿では2つのエンコーダが暗黙的に外観と動きの特徴をモデル化する構造である暗黙の2経路AE(ITAE)を提案する。
通常のシーンの複雑な分布については,ITAE特徴量の正規密度推定を提案する。
NFモデルは暗黙的に学習された機能を通じて正常性を学ぶことでITAEのパフォーマンスを高める。
論文 参考訳(メタデータ) (2020-10-15T05:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。