論文の概要: Siamese Transition Masked Autoencoders as Uniform Unsupervised Visual
Anomaly Detector
- arxiv url: http://arxiv.org/abs/2211.00349v1
- Date: Tue, 1 Nov 2022 09:45:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:59:32.427885
- Title: Siamese Transition Masked Autoencoders as Uniform Unsupervised Visual
Anomaly Detector
- Title(参考訳): 一様教師なし視覚異常検出器としてのシームズ遷移マスクオートエンコーダ
- Authors: Haiming Yao, Xue Wang, Wenyong Yu
- Abstract要約: 本稿では,様々な視覚異常検出タスクを均一に処理するための,Samese Transition Masked Autoencoders (ST-MAE) と呼ばれる新しいフレームワークを提案する。
我々の深い特徴遷移スキームは、通常のパターンを抽出する非教師付きセマンティックな自己監督タスクをもたらす。
- 参考スコア(独自算出の注目度): 4.33060257697635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised visual anomaly detection conveys practical significance in many
scenarios and is a challenging task due to the unbounded definition of
anomalies. Moreover, most previous methods are application-specific, and
establishing a unified model for anomalies across application scenarios remains
unsolved. This paper proposes a novel hybrid framework termed Siamese
Transition Masked Autoencoders(ST-MAE) to handle various visual anomaly
detection tasks uniformly via deep feature transition. Concretely, the proposed
method first extracts hierarchical semantics features from a pre-trained deep
convolutional neural network and then develops a feature decoupling strategy to
split the deep features into two disjoint feature patch subsets. Leveraging the
decoupled features, the ST-MAE is developed with the Siamese encoders that
operate on each subset of feature patches and perform the latent
representations transition of two subsets, along with a lightweight decoder
that reconstructs the original feature from the transitioned latent
representation. Finally, the anomalous attributes can be detected using the
semantic deep feature residual. Our deep feature transition scheme yields a
nontrivial and semantic self-supervisory task to extract prototypical normal
patterns, which allows for learning uniform models that generalize well for
different visual anomaly detection tasks. The extensive experiments conducted
demonstrate that the proposed ST-MAE method can advance state-of-the-art
performance on multiple benchmarks across application scenarios with a superior
inference efficiency, which exhibits great potential to be the uniform model
for unsupervised visual anomaly detection.
- Abstract(参考訳): 教師なし視覚異常検出は、多くのシナリオにおいて実践的な重要性を伝達し、無拘束な異常の定義のために難しい課題である。
さらに、以前のほとんどのメソッドはアプリケーション固有であり、アプリケーションシナリオにまたがる異常に対する統一モデルを確立することは未解決である。
本稿では,多種多様な視覚異常検出タスクを深い特徴遷移により均一に処理する,Samese Transition Masked Autoencoders (ST-MAE) と呼ばれるハイブリッドフレームワークを提案する。
具体的には,まず,事前学習した深層畳み込みニューラルネットワークから階層的セマンティクス特徴を抽出し,その後,深い特徴を2つの異なる特徴パッチサブセットに分割するための特徴分離戦略を開発した。
分離された特徴を活用してST-MAEは、機能パッチの各サブセットで動作し、2つのサブセットの潜在表現遷移を実行するシームズエンコーダと、遷移した潜在表現から元の機能を再構築する軽量デコーダと共に開発された。
最後に、意味深い特徴残差を用いて異常属性を検出することができる。
我々の深い特徴遷移スキームは、原型的正規パターンを抽出するための非自明で意味的な自己スーパーバイザリーなタスクをもたらし、異なる視覚異常検出タスクにうまく一般化する一様モデルの学習を可能にします。
広範な実験により,st-mae法により,アプリケーションシナリオを横断する複数のベンチマークにおける最先端性能を,優れた推論効率で向上し,教師なし視覚異常検出の一様モデルとなる可能性が示唆された。
関連論文リスト
- Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Continuous Memory Representation for Anomaly Detection [24.58611060347548]
CRADは「連続的」メモリ内の正常な特徴を表現するための新しい異常検出手法である。
MVTec ADデータセットを用いた評価では、CRADは、マルチクラス統一異常検出におけるエラーの65.0%を削減し、従来の最先端手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-02-28T12:38:44Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Open-Vocabulary Video Anomaly Detection [57.552523669351636]
監視の弱いビデオ異常検出(VAD)は、ビデオフレームが正常であるか異常であるかを識別するためにビデオレベルラベルを利用する際、顕著な性能を達成した。
近年の研究は、より現実的な、オープンセットのVADに取り組み、異常や正常なビデオから見えない異常を検出することを目的としている。
本稿ではさらに一歩前進し、未確認および未確認の異常を検知・分類するために訓練済みの大規模モデルを活用することを目的とした、オープン語彙ビデオ異常検出(OVVAD)について検討する。
論文 参考訳(メタデータ) (2023-11-13T02:54:17Z) - LafitE: Latent Diffusion Model with Feature Editing for Unsupervised
Multi-class Anomaly Detection [12.596635603629725]
我々は,通常のデータのみにアクセス可能な場合に,複数のクラスに属するオブジェクトから異常を検出する統一モデルを開発した。
まず、生成的アプローチについて検討し、再構成のための潜伏拡散モデルについて検討する。
「拡散モデルの入力特徴空間を修正し、アイデンティティショートカットをさらに緩和する特徴編集戦略を導入する。」
論文 参考訳(メタデータ) (2023-07-16T14:41:22Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Unsupervised Two-Stage Anomaly Detection [18.045265572566276]
単一の画像からの異常検出は、異常データが常に稀で、予測不能な型を持つ可能性があるため、難しい。
本研究では,高忠実かつ異常のない再構成を生成する2段階アプローチを提案する。
提案手法は,4つの異常検出データセットの最先端性能を上回っている。
論文 参考訳(メタデータ) (2021-03-22T08:57:27Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。