論文の概要: SCL-VI: Self-supervised Context Learning for Visual Inspection of
Industrial Defects
- arxiv url: http://arxiv.org/abs/2311.06504v2
- Date: Tue, 21 Nov 2023 14:57:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 04:02:14.218364
- Title: SCL-VI: Self-supervised Context Learning for Visual Inspection of
Industrial Defects
- Title(参考訳): SCL-VI:産業欠陥の視覚検査のための自己教師型文脈学習
- Authors: Peng Wang, Haiming Yao, Wenyong Yu
- Abstract要約: 本稿では,有名なジグソーパズルに取り組むことで,最適なエンコーダを導出する自己教師型学習アルゴリズムを提案する。
提案手法では, 対象画像を9つのパッチに分割し, エンコーダに2つのパッチ間の相対的な位置関係を予測して, リッチなセマンティクスを抽出する。
- 参考スコア(独自算出の注目度): 4.487908181569429
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The unsupervised visual inspection of defects in industrial products poses a
significant challenge due to substantial variations in product surfaces.
Current unsupervised models struggle to strike a balance between detecting
texture and object defects, lacking the capacity to discern latent
representations and intricate features. In this paper, we present a novel
self-supervised learning algorithm designed to derive an optimal encoder by
tackling the renowned jigsaw puzzle. Our approach involves dividing the target
image into nine patches, tasking the encoder with predicting the relative
position relationships between any two patches to extract rich semantics.
Subsequently, we introduce an affinity-augmentation method to accentuate
differences between normal and abnormal latent representations. Leveraging the
classic support vector data description algorithm yields final detection
results. Experimental outcomes demonstrate that our proposed method achieves
outstanding detection and segmentation performance on the widely used MVTec AD
dataset, with rates of 95.8% and 96.8%, respectively, establishing a
state-of-the-art benchmark for both texture and object defects. Comprehensive
experimentation underscores the effectiveness of our approach in diverse
industrial applications.
- Abstract(参考訳): 産業製品における欠陥の教師なし視覚検査は、製品表面のかなりの変化のために重大な課題となる。
現在の教師なしモデルは、テクスチャの検出とオブジェクトの欠陥のバランスを保ち、遅延表現と複雑な特徴を識別する能力が欠如している。
本稿では,有名なジグソーパズルに取り組むことで,最適なエンコーダを導出する自己教師型学習アルゴリズムを提案する。
目的画像を9つのパッチに分割し、エンコーダに2つのパッチ間の相対的な位置関係を予測させ、リッチなセマンティクスを抽出する。
次に,正規表現と異常表現の差異を強調する親和性提示法を提案する。
古典的サポートベクトルデータ記述アルゴリズムを活用すると、最終的な検出結果が得られる。
実験結果から,広範に使用されているMVTec ADデータセットにおいて,95.8%,96.8%の精度で検出およびセグメンテーション性能が向上し,テクスチャとオブジェクトの両欠陥に対する最先端のベンチマークが確立された。
包括的実験は,多種多様な産業応用における我々のアプローチの有効性を強調する。
関連論文リスト
- Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - CL-Flow:Strengthening the Normalizing Flows by Contrastive Learning for
Better Anomaly Detection [1.951082473090397]
コントラスト学習と2D-Flowを組み合わせた自己教師付き異常検出手法を提案する。
本手法は,主流の教師なし手法と比較して,検出精度が向上し,モデルパラメータが減少し,推論速度が向上することを示す。
BTADデータセットでは,MVTecADデータセットでは画像レベルのAUROCが99.6%,BTADデータセットでは画像レベルのAUROCが96.8%であった。
論文 参考訳(メタデータ) (2023-11-12T10:07:03Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - ReConPatch : Contrastive Patch Representation Learning for Industrial
Anomaly Detection [5.998761048990598]
本稿では,事前学習モデルから抽出したパッチ特徴の線形変調を訓練することにより,異常検出のための識別機能を構築するReConPatchを紹介する。
本手法は,MVTec ADデータセットに対して,最先端の異常検出性能(99.72%)を実現する。
論文 参考訳(メタデータ) (2023-05-26T07:59:36Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - Contrastive Predictive Coding for Anomaly Detection [0.0]
対照的予測符号化モデル (arXiv:1807.03748) は異常検出とセグメンテーションに使用される。
パッチワイドのコントラスト損失を直接異常スコアと解釈できることを示す。
ModelはMVTec-ADデータセット上の異常検出とセグメンテーションの両方に対して有望な結果を達成する。
論文 参考訳(メタデータ) (2021-07-16T11:04:35Z) - Zero-sample surface defect detection and classification based on
semantic feedback neural network [13.796631421521765]
本論文では,複数角度からの画像タグ埋め込みにおける予測誤差を適応的に低減するアンサンブル協調学習アルゴリズムを提案する。
産業分野におけるゼロショットデータセットとシリンダーライナーデータセットを用いた各種実験により,競争結果が得られた。
論文 参考訳(メタデータ) (2021-06-15T08:26:36Z) - Generative Partial Visual-Tactile Fused Object Clustering [81.17645983141773]
オブジェクトクラスタリングのためのGenerative Partial Visual-Tactile Fused(GPVTF)フレームワークを提案する。
条件付きクロスモーダルクラスタリング生成逆ネットワークを開発し、一方のモダリティ条件を他方のモダリティ上で合成する。
最後に、擬似ラベルに基づく2つのKL分割損失を用いて、対応するモダリティ固有エンコーダを更新する。
論文 参考訳(メタデータ) (2020-12-28T02:37:03Z) - ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。
提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文 参考訳(メタデータ) (2020-12-09T08:16:35Z) - Patch SVDD: Patch-level SVDD for Anomaly Detection and Segmentation [30.499125737099185]
異常検出は、入力画像が異常を含むかどうかを二項決定する。
我々は,自己教師付き学習を用いたパッチベースの手法に,サポートベクタデータ記述(SVDD)を拡張した。
本研究は,提案手法の有効性と産業応用の可能性を示すものである。
論文 参考訳(メタデータ) (2020-06-29T14:19:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。