論文の概要: ISSTAD: Incremental Self-Supervised Learning Based on Transformer for
Anomaly Detection and Localization
- arxiv url: http://arxiv.org/abs/2303.17354v4
- Date: Fri, 28 Apr 2023 22:10:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 18:05:05.267637
- Title: ISSTAD: Incremental Self-Supervised Learning Based on Transformer for
Anomaly Detection and Localization
- Title(参考訳): ISSTAD: 異常検出と局所化のためのトランスフォーマに基づくインクリメンタル自己監督学習
- Authors: Wenping Jin, Fei Guo, Li Zhu
- Abstract要約: 本稿では,Transformerのバックボーンネットワークに基づく新しいアプローチを提案する。
通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。
その後の段階では、劣化した正規画像を生成するためにピクセルレベルのデータ拡張技術を適用する。
このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
- 参考スコア(独自算出の注目度): 12.975540251326683
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of machine learning, the study of anomaly detection and
localization within image data has gained substantial traction, particularly
for practical applications such as industrial defect detection. While the
majority of existing methods predominantly use Convolutional Neural Networks
(CNN) as their primary network architecture, we introduce a novel approach
based on the Transformer backbone network. Our method employs a two-stage
incremental learning strategy. During the first stage, we train a Masked
Autoencoder (MAE) model solely on normal images. In the subsequent stage, we
apply pixel-level data augmentation techniques to generate corrupted normal
images and their corresponding pixel labels. This process allows the model to
learn how to repair corrupted regions and classify the status of each pixel.
Ultimately, the model generates a pixel reconstruction error matrix and a pixel
anomaly probability matrix. These matrices are then combined to produce an
anomaly scoring matrix that effectively detects abnormal regions. When
benchmarked against several state-of-the-art CNN-based methods, our approach
exhibits superior performance on the MVTec AD dataset, achieving an impressive
97.6% AUC.
- Abstract(参考訳): 機械学習の分野では、画像データ内の異常検出と局所化の研究が、特に工業的欠陥検出などの実践的応用において、大きな注目を集めている。
既存の手法の大部分は畳み込みニューラルネットワーク(cnn)を主要なネットワークアーキテクチャとして使用しているが、トランスフォーマーバックボーンネットワークに基づく新しいアプローチを導入する。
本手法は2段階のインクリメンタル学習戦略を用いる。
第1段階では、通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。
その後の段階では、劣化した正規画像とその対応するピクセルラベルを生成するためにピクセルレベルのデータ拡張技術を適用する。
このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
最終的に、モデルが画素再構成誤差行列と画素異常確率行列を生成する。
これらの行列を組み合わせ、異常領域を効果的に検出する異常スコアリングマトリックスを生成する。
最新のCNNベースのいくつかの手法をベンチマークすると、MVTec ADデータセット上で優れた性能を示し、97.6%のAUCを達成した。
関連論文リスト
- LADMIM: Logical Anomaly Detection with Masked Image Modeling in Discrete Latent Space [0.0]
マスク付き画像モデリングは、画像中のマスキング領域の特徴表現を予測する自己教師付き学習技術である。
本稿では,MIMの特性を利用して論理異常を効果的に検出する手法を提案する。
提案手法をMVTecLOCOデータセット上で評価し,平均AUC 0.867。
論文 参考訳(メタデータ) (2024-10-14T07:50:56Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - A Prototype-Based Neural Network for Image Anomaly Detection and Localization [10.830337829732915]
本稿では,画像の異常検出と局所化のためのプロトタイプベースニューラルネットワークProtoADを提案する。
まず,自然画像に事前学習したディープネットワークにより,通常の画像のパッチの特徴を抽出する。
ProtoADは、推論速度の高い最先端の手法と比較して、競争性能が向上する。
論文 参考訳(メタデータ) (2023-10-04T04:27:16Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - FRE: A Fast Method For Anomaly Detection And Segmentation [5.0468312081378475]
本稿では,視覚異常検出とセグメンテーション問題を解決するための原理的アプローチを提案する。
本稿では,事前学習したDNNが生み出す中間特性に対する線形統計量次元削減手法の適用について述べる。
高次元空間における原特徴と低次元縮小埋め込みの前像との差の$ell$-normのEmphfeature reconstruction error (FRE) が異常検出に極めて有効であることを示す。
論文 参考訳(メタデータ) (2022-11-23T01:03:20Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Unsupervised Industrial Anomaly Detection via Pattern Generative and Contrastive Networks [6.393288885927437]
本稿では,視覚変換器を用いた教師なし異常検出ネットワークを提案する。
階層的なタスク学習と人間の経験を利用して、その解釈可能性を高めます。
従来の最先端手法を超越した99.8%のAUCを実現した。
論文 参考訳(メタデータ) (2022-07-20T10:09:53Z) - One-Stage Deep Edge Detection Based on Dense-Scale Feature Fusion and
Pixel-Level Imbalance Learning [5.370848116287344]
後処理なしで高品質なエッジ画像を生成することができる一段階ニューラルネットワークモデルを提案する。
提案モデルでは、トレーニング済みのニューラルモデルをエンコーダとして使用する古典的なエンコーダデコーダフレームワークを採用している。
本稿では,エッジ画像の画素レベルの不均衡に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2022-03-17T15:26:00Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。