論文の概要: Contrastive Augmented Transformer with Domain-specific Enhancement for Robust Multi-scenario Metal Surface Defect Detection
- arxiv url: http://arxiv.org/abs/2606.01962v2
- Date: Tue, 02 Jun 2026 06:20:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 18:57:50.476619
- Title: Contrastive Augmented Transformer with Domain-specific Enhancement for Robust Multi-scenario Metal Surface Defect Detection
- Title(参考訳): ロバストな多段金属表面欠陥検出のためのドメイン特化型コントラスト強化変圧器
- Authors: Yiyao Liu, Wenxiao He, Liyuan Ren, Huan Wang,
- Abstract要約: 本稿では,堅牢な欠陥検出のためのコントラスト拡張トランス(CAT)フレームワークを提案する。
Catは階層的なSwin Transformerのバックボーンを採用し、機能ピラミッドネットワークを再設計して、低レベルのテクスチャと高レベルのセマンティクスを効果的に融合させる。
KolektorSDD2データセットの実験結果は、CATが99.54%のピクセルレベルのAUROCを達成し、既存の手法より優れていることを示した。
- 参考スコア(独自算出の注目度): 5.99044277576746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Metal surface defect detection is critical for maintaining product quality in industrial manufacturing. However, it faces significant challenges, including limited annotated data, difficulty in identifying subtle multi-scale defects, and poor generalization across diverse scenarios. To address these issues, this paper proposes a novel Contrastive Augmented Transformer (CAT) framework for robust defect detection. CAT employs a hierarchical Swin Transformer backbone and redesigns the feature pyramid network to effectively fuse low-level textures with high-level semantics, enabling precise modeling of subtle and multi-scale defect patterns. To enhance robustness under real-world noise conditions, we propose a domain-specific droplet augmentation algorithm. Furthermore, we incorporate a hard negative mining strategy into the contrastive loss to strengthen the model's discrimination ability in ambiguous defect regions. Experimental results on the KolektorSDD2 dataset demonstrate that CAT achieves a pixel-level AUROC of 99.54%, outperforming existing methods. In addition, CAT exhibits superior generalization and robustness on three unseen datasets, including KSDD1, MTD for tile defects, and MSDD for rail surface defects, demonstrating its potential for wide-scale industrial deployment.
- Abstract(参考訳): 金属表面欠陥検出は工業製品の品質維持に重要である。
しかし、限られた注釈付きデータ、微妙なマルチスケールの欠陥を特定することの難しさ、さまざまなシナリオにおける一般化の欠如など、大きな課題に直面している。
これらの問題に対処するために, 堅牢な欠陥検出のための新しいContrastive Augmented Transformer (CAT) フレームワークを提案する。
CATは階層的なSwin Transformerのバックボーンを採用し、機能ピラミッドネットワークを再設計して、低レベルのテクスチャを高レベルのセマンティクスで効果的に融合し、微妙でマルチスケールの欠陥パターンの正確なモデリングを可能にする。
実世界の騒音条件下でのロバスト性を高めるため,ドメイン固有のドロップレット拡張アルゴリズムを提案する。
さらに, 不明瞭な欠陥領域におけるモデルの識別能力を高めるために, 強硬な負のマイニング戦略を対照的な損失に取り入れた。
KolektorSDD2データセットの実験結果は、CATが99.54%のピクセルレベルのAUROCを達成し、既存の手法より優れていることを示した。
さらに、CATは、KSDD1、タイル欠陥のためのMTD、レール表面欠陥のためのMSDDを含む3つの目に見えないデータセットに対して、より優れた一般化と堅牢性を示し、大規模産業展開の可能性を示している。
関連論文リスト
- Text-Guided Multimodal Unified Industrial Anomaly Detection [71.95719669933312]
そこで本研究では,テキストセマンティクスによって導かれる多モーダル産業異常検出フレームワークを提案する。
フレームワークは、Geometry-Aware Cross-Modal MapperとObject-Conditioned Textual Feature Adaptorの2つのコアモジュールで構成されている。
本手法は,教師なし環境下での分類とローカライゼーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2026-04-24T13:21:22Z) - Large-Scale Universal Defect Generation: Foundation Models and Datasets [51.150071370083026]
様々な領域にまたがる300Kの正規マスクカプセルの大規模データセットUDGを紹介する。
我々は,参照ベース欠陥生成とテキスト命令ベース欠陥編集の両方をサポートするユニバーサル欠陥生成基盤モデルUniDGを提案する。
MVTec-AD と VisA の実験では、UniDG は合成品質および下流の単クラスおよび複数クラスの異常検出/局所化において、前回の少数ショット異常発生および画像挿入/編集ベースラインより優れていた。
論文 参考訳(メタデータ) (2026-04-10T03:21:17Z) - Amped: Adaptive Multi-stage Non-edge Pruning for Edge Detection [53.59823657644554]
エッジ検出のための適応型多段非エッジプルーニングフレームワーク(Amped)を提案する。
Ampedは高信頼の非エッジトークンを識別し、可能な限り早く削除し、計算を大幅に削減する。
既存のエッジ検出ネットワークの構造的複雑さを軽減するため,Streamline Edge Detector(SED)と呼ばれる,シンプルながら高性能なTransformerベースのモデルを導入する。
論文 参考訳(メタデータ) (2026-03-29T12:26:35Z) - A Steel Surface Defect Detection Method Based on Lightweight Convolution Optimization [12.113216180751605]
本研究では,欠陥検出精度とモデル性能を改善するために,ディープラーニング,特にYOLOv9sに基づく検出フレームワークを提案する。
実験により, 鋼表面欠陥検出タスクにおいて, 他の手法と比較して高精度かつ堅牢性が得られることを示した。
論文 参考訳(メタデータ) (2025-07-21T10:30:38Z) - PA-CLIP: Enhancing Zero-Shot Anomaly Detection through Pseudo-Anomaly Awareness [10.364634539199422]
本稿では,背景雑音を低減し,擬似異常に基づくフレームワークによる欠陥検出を向上するゼロショット異常検出手法であるPA-CLIPを紹介する。
提案手法は,グローバルおよびローカルの詳細な情報を収集するためのマルチスケール特徴集約戦略を統合する。
既存のゼロショット法よりも優れており、工業的欠陥検出のための堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2025-03-03T08:29:27Z) - Scalable AI Framework for Defect Detection in Metal Additive Manufacturing [2.303463009749888]
我々は、畳み込みニューラルネットワーク(CNN)を利用してプリント層の熱画像を分析し、これらの特性に影響を与える異常を自動的に識別する。
我々はこれらのモデルをCLoud ADditive Manufacturing (CLADMA)モジュールに統合し、AMアプリケーションのアクセシビリティと実用性を向上させる。
論文 参考訳(メタデータ) (2024-11-01T18:17:59Z) - Change-Aware Siamese Network for Surface Defects Segmentation under Complex Background [0.6407952035735353]
変更検出フレームワークにおける欠陥セグメント化を解消する変更対応のSiameseネットワークを提案する。
トランスフォーマーベースのエンコーダを導くために,新しいマルチクラスのコントラスト損失を導入した。
距離マップで示される差分は、変更対応デコーダにスキップ接続され、クラス間およびクラス外の両方の欠陥の位置をアシストする。
論文 参考訳(メタデータ) (2024-09-01T02:48:11Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - CINFormer: Transformer network with multi-stage CNN feature injection
for surface defect segmentation [73.02218479926469]
表面欠陥分割のための多段CNN特徴注入を用いた変圧器ネットワークを提案する。
CINFormerは、入力画像のマルチレベルCNN機能をエンコーダ内のトランスフォーマーネットワークの異なるステージに注入する、シンプルだが効果的な機能統合機構を提供する。
さらに、CINFormerはTop-Kセルフアテンションモジュールを提供し、欠陥に関するより重要な情報を持つトークンにフォーカスする。
論文 参考訳(メタデータ) (2023-09-22T06:12:02Z) - A New Knowledge Distillation Network for Incremental Few-Shot Surface
Defect Detection [20.712532953953808]
本稿では,DKAN(Dual Knowledge Align Network)と呼ばれる新しい知識蒸留ネットワークを提案する。
提案したDKAN法は,事前学習型ファインタニング伝達学習パラダイムを踏襲し,ファインタニングのための知識蒸留フレームワークを設計した。
Few-shot NEU-DETデータセットをインクリメンタルに実験した結果、DKANは様々なシーンで他の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-09-01T15:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。