論文の概要: Generalizable Industrial Visual Anomaly Detection with Self-Induction
Vision Transformer
- arxiv url: http://arxiv.org/abs/2211.12311v1
- Date: Tue, 22 Nov 2022 14:56:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 18:30:30.200224
- Title: Generalizable Industrial Visual Anomaly Detection with Self-Induction
Vision Transformer
- Title(参考訳): 自己誘導型視覚変換器を用いた産業用視覚異常検出
- Authors: Haiming Yao, Xue Wang
- Abstract要約: 産業用視覚異常検出・局所化のための自己誘導型視覚変換器(SIVT)を提案する。
提案したSIVTは、まず、事前学習したCNNからプロパティ記述子として識別特徴を抽出し、抽出した特徴を自己監督的に再構成する。
その結果,AUROCでは2.8-6.3,APでは3.3-7.6の改善により,最先端検出性能を向上できることがわかった。
- 参考スコア(独自算出の注目度): 5.116033262865781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial vision anomaly detection plays a critical role in the advanced
intelligent manufacturing process, while some limitations still need to be
addressed under such a context. First, existing reconstruction-based methods
struggle with the identity mapping of trivial shortcuts where the
reconstruction error gap is legible between the normal and abnormal samples,
leading to inferior detection capabilities. Then, the previous studies mainly
concentrated on the convolutional neural network (CNN) models that capture the
local semantics of objects and neglect the global context, also resulting in
inferior performance. Moreover, existing studies follow the individual learning
fashion where the detection models are only capable of one category of the
product while the generalizable detection for multiple categories has not been
explored. To tackle the above limitations, we proposed a self-induction vision
Transformer(SIVT) for unsupervised generalizable multi-category industrial
visual anomaly detection and localization. The proposed SIVT first extracts
discriminatory features from pre-trained CNN as property descriptors. Then, the
self-induction vision Transformer is proposed to reconstruct the extracted
features in a self-supervisory fashion, where the auxiliary induction tokens
are additionally introduced to induct the semantics of the original signal.
Finally, the abnormal properties can be detected using the semantic feature
residual difference. We experimented with the SIVT on existing Mvtec AD
benchmarks, the results reveal that the proposed method can advance
state-of-the-art detection performance with an improvement of 2.8-6.3 in AUROC,
and 3.3-7.6 in AP.
- Abstract(参考訳): 産業的ビジョン異常検出は高度な知的製造プロセスにおいて重要な役割を担っているが、そのような状況下では、いくつかの制限に対処する必要がある。
まず, 既往の復元法は, 正常試料と異常試料との再構成誤差ギャップが正当である自明なショートカットの同一性マッピングに苦慮し, 検出能力の低下につながる。
次に,これまでの研究は主に,オブジェクトの局所的な意味を捉えてグローバルコンテキストを無視する畳み込みニューラルネットワーク(cnn)モデルに焦点をあてた。
さらに、既存の研究は、検出モデルが製品の1つのカテゴリしか持たない個々の学習手法に従っているが、複数のカテゴリに対する一般化可能な検出は検討されていない。
上記の制約に対処するため、教師なしの一般化可能な産業用視覚異常検出と位置決めのための自己誘導型視覚変換器(SIVT)を提案する。
The proposed SIVT first extracts discriminatory features from pre-trained CNN as property descriptors。
そして、自己誘導型視覚変換器を提案し、抽出した特徴を自己監督的に再構成し、補助誘導トークンを付加して元の信号の意味を誘導する。
最後に、セマンティクス特徴残差を用いて異常特性を検出することができる。
既存のMvtec ADベンチマークでSIVTを実験した結果,AUROCでは2.8-6.3,APでは3.3-7.6の改善により,最先端検出性能を向上できることがわかった。
関連論文リスト
- Prior Normality Prompt Transformer for Multi-class Industrial Image Anomaly Detection [6.865429486202104]
マルチクラス異常検出のためのPNPT(Presideor Normality Prompt Transformer)を導入する。
PNPTは戦略的に通常の意味論を取り入れ、「アイデンティティマッピング」問題を緩和する。
これにより、事前の正規性プロンプトを再構築プロセスに統合し、二重ストリームモデルを生成する。
論文 参考訳(メタデータ) (2024-06-17T13:10:04Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - LafitE: Latent Diffusion Model with Feature Editing for Unsupervised
Multi-class Anomaly Detection [12.596635603629725]
我々は,通常のデータのみにアクセス可能な場合に,複数のクラスに属するオブジェクトから異常を検出する統一モデルを開発した。
まず、生成的アプローチについて検討し、再構成のための潜伏拡散モデルについて検討する。
「拡散モデルの入力特徴空間を修正し、アイデンティティショートカットをさらに緩和する特徴編集戦略を導入する。」
論文 参考訳(メタデータ) (2023-07-16T14:41:22Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - ADTR: Anomaly Detection Transformer with Feature Reconstruction [40.68590890351697]
通常のサンプルからの事前知識のみによる異常検出が注目されている。
既存のCNNベースの画素再構成アプローチには2つの懸念がある。
本稿では,事前学習した特徴の再構成にトランスフォーマを適用するために,ADTR(Anomaly Detection TRansformer)を提案する。
論文 参考訳(メタデータ) (2022-09-05T08:01:27Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Test-time Adaptation with Slot-Centric Models [63.981055778098444]
Slot-TTAは、半教師付きシーン分解モデルであり、シーンごとのテスト時間は、再構成やクロスビュー合成の目的に対する勾配降下を通じて適用される。
我々は、最先端の監視フィードフォワード検出器と代替テスト時間適応法に対して、配電性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-03-21T17:59:50Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。