Fugu-MT 論文翻訳(概要): SCL-VI: Self-supervised Context Learning for Visual Inspection of Industrial Defects

論文の概要: SCL-VI: Self-supervised Context Learning for Visual Inspection of Industrial Defects

arxiv url: http://arxiv.org/abs/2311.06504v2
Date: Tue, 21 Nov 2023 14:57:09 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 04:02:14.218364
Title: SCL-VI: Self-supervised Context Learning for Visual Inspection of Industrial Defects
Title（参考訳）: SCL-VI:産業欠陥の視覚検査のための自己教師型文脈学習
Authors: Peng Wang, Haiming Yao, Wenyong Yu
Abstract要約: 本稿では,有名なジグソーパズルに取り組むことで,最適なエンコーダを導出する自己教師型学習アルゴリズムを提案する。提案手法では, 対象画像を9つのパッチに分割し, エンコーダに2つのパッチ間の相対的な位置関係を予測して, リッチなセマンティクスを抽出する。
参考スコア（独自算出の注目度）: 4.487908181569429
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The unsupervised visual inspection of defects in industrial products poses a significant challenge due to substantial variations in product surfaces. Current unsupervised models struggle to strike a balance between detecting texture and object defects, lacking the capacity to discern latent representations and intricate features. In this paper, we present a novel self-supervised learning algorithm designed to derive an optimal encoder by tackling the renowned jigsaw puzzle. Our approach involves dividing the target image into nine patches, tasking the encoder with predicting the relative position relationships between any two patches to extract rich semantics. Subsequently, we introduce an affinity-augmentation method to accentuate differences between normal and abnormal latent representations. Leveraging the classic support vector data description algorithm yields final detection results. Experimental outcomes demonstrate that our proposed method achieves outstanding detection and segmentation performance on the widely used MVTec AD dataset, with rates of 95.8% and 96.8%, respectively, establishing a state-of-the-art benchmark for both texture and object defects. Comprehensive experimentation underscores the effectiveness of our approach in diverse industrial applications.
Abstract（参考訳）: 産業製品における欠陥の教師なし視覚検査は、製品表面のかなりの変化のために重大な課題となる。現在の教師なしモデルは、テクスチャの検出とオブジェクトの欠陥のバランスを保ち、遅延表現と複雑な特徴を識別する能力が欠如している。本稿では,有名なジグソーパズルに取り組むことで,最適なエンコーダを導出する自己教師型学習アルゴリズムを提案する。目的画像を9つのパッチに分割し、エンコーダに2つのパッチ間の相対的な位置関係を予測させ、リッチなセマンティクスを抽出する。次に,正規表現と異常表現の差異を強調する親和性提示法を提案する。古典的サポートベクトルデータ記述アルゴリズムを活用すると、最終的な検出結果が得られる。実験結果から,広範に使用されているMVTec ADデータセットにおいて,95.8%,96.8%の精度で検出およびセグメンテーション性能が向上し,テクスチャとオブジェクトの両欠陥に対する最先端のベンチマークが確立された。包括的実験は,多種多様な産業応用における我々のアプローチの有効性を強調する。

関連論文リスト

OmniAD: Detect and Understand Industrial Anomaly via Multimodal Reasoning [76.90511414963265]
我々は,微粒化解析のための異常検出と理解を統一するフレームワークであるOmniADを紹介した。ビジュアル推論は、Text-as-Maskを活用することで詳細なインスペクションを提供する。 Visual Guided Textual Reasoningは、視覚知覚を統合することで包括的な分析を行う。
論文参考訳（メタデータ） (2025-05-28T07:02:15Z)
Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.343419243749054]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (2025-04-15T10:42:25Z)
Patch-aware Vector Quantized Codebook Learning for Unsupervised Visual Defect Detection [4.081433571732692]
産業応用においては、教師なしの視覚欠陥検出が重要である。教師なし欠陥検出に最適化された拡張VQ-VAEフレームワークを用いた新しい手法を提案する。
論文参考訳（メタデータ） (2025-01-15T22:26:26Z)
Exploring Large Vision-Language Models for Robust and Efficient Industrial Anomaly Detection [4.691083532629246]
CLAD(Contrastive Cross-Modal Training)を用いた視覚言語異常検出法を提案する。 CLADは、視覚的特徴とテキスト的特徴をコントラスト学習を用いて共有埋め込み空間に整列する。 CLADは画像レベルの異常検出と画素レベルの異常局所化の両方において最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2024-12-01T17:00:43Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文参考訳（メタデータ） (2024-01-06T07:30:41Z)
CL-Flow:Strengthening the Normalizing Flows by Contrastive Learning for Better Anomaly Detection [1.951082473090397]
コントラスト学習と2D-Flowを組み合わせた自己教師付き異常検出手法を提案する。本手法は,主流の教師なし手法と比較して,検出精度が向上し,モデルパラメータが減少し,推論速度が向上することを示す。 BTADデータセットでは,MVTecADデータセットでは画像レベルのAUROCが99.6%,BTADデータセットでは画像レベルのAUROCが96.8%であった。
論文参考訳（メタデータ） (2023-11-12T10:07:03Z)
Improving Vision Anomaly Detection with the Guidance of Language Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文参考訳（メタデータ） (2023-10-04T13:44:56Z)
ReConPatch : Contrastive Patch Representation Learning for Industrial Anomaly Detection [5.998761048990598]
本稿では,事前学習モデルから抽出したパッチ特徴の線形変調を訓練することにより,異常検出のための識別機能を構築するReConPatchを紹介する。本手法は,MVTec ADデータセットに対して,最先端の異常検出性能(99.72%)を実現する。
論文参考訳（メタデータ） (2023-05-26T07:59:36Z)
Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文参考訳（メタデータ） (2021-12-15T01:45:32Z)
Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文参考訳（メタデータ） (2021-08-10T05:44:23Z)
Contrastive Predictive Coding for Anomaly Detection [0.0]
対照的予測符号化モデル (arXiv:1807.03748) は異常検出とセグメンテーションに使用される。パッチワイドのコントラスト損失を直接異常スコアと解釈できることを示す。 ModelはMVTec-ADデータセット上の異常検出とセグメンテーションの両方に対して有望な結果を達成する。
論文参考訳（メタデータ） (2021-07-16T11:04:35Z)
Zero-sample surface defect detection and classification based on semantic feedback neural network [13.796631421521765]
本論文では,複数角度からの画像タグ埋め込みにおける予測誤差を適応的に低減するアンサンブル協調学習アルゴリズムを提案する。産業分野におけるゼロショットデータセットとシリンダーライナーデータセットを用いた各種実験により,競争結果が得られた。
論文参考訳（メタデータ） (2021-06-15T08:26:36Z)
Generative Partial Visual-Tactile Fused Object Clustering [81.17645983141773]
オブジェクトクラスタリングのためのGenerative Partial Visual-Tactile Fused(GPVTF)フレームワークを提案する。条件付きクロスモーダルクラスタリング生成逆ネットワークを開発し、一方のモダリティ条件を他方のモダリティ上で合成する。最後に、擬似ラベルに基づく2つのKL分割損失を用いて、対応するモダリティ固有エンコーダを更新する。
論文参考訳（メタデータ） (2020-12-28T02:37:03Z)
ESAD: End-to-end Deep Semi-supervised Anomaly Detection [85.81138474858197]
正規データと異常データの間のKL偏差を計測する新たな目的関数を提案する。提案手法は,複数のベンチマークデータセットの最先端性能を著しく上回っている。
論文参考訳（メタデータ） (2020-12-09T08:16:35Z)
Patch SVDD: Patch-level SVDD for Anomaly Detection and Segmentation [30.499125737099185]
異常検出は、入力画像が異常を含むかどうかを二項決定する。我々は,自己教師付き学習を用いたパッチベースの手法に,サポートベクタデータ記述(SVDD)を拡張した。本研究は,提案手法の有効性と産業応用の可能性を示すものである。
論文参考訳（メタデータ） (2020-06-29T14:19:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。