論文の概要: GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module
- arxiv url: http://arxiv.org/abs/2603.07566v1
- Date: Sun, 08 Mar 2026 10:02:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.813762
- Title: GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module
- Title(参考訳): GRD-Net:関心注意モジュールの領域を用いた生成・再構成・識別異常検出
- Authors: Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma,
- Abstract要約: 2ブロックからなる新しいアーキテクチャを提案する。
最初のブロックはGAN(Generative Adversarial Network)であり、残余のオートエンコーダ(ResAE)に基づいて再構成および復調処理を行う。
2番目のブロックは画像のセグメンテーションを生成し、欠陥を発見できる。
- 参考スコア(独自算出の注目度): 0.0509780930114934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection is nowadays increasingly used in industrial applications and processes. One of the main fields of the appliance is the visual inspection for surface anomaly detection, which aims to spot regions that deviate from regularity and consequently identify abnormal products. Defect localization is a key task, that usually is achieved using a basic comparison between generated image and the original one, implementing some blob-analysis or image-editing algorithms, in the post-processing step, which is very biased towards the source dataset, and they are unable to generalize. Furthermore, in industrial applications, the totality of the image is not always interesting but could be one or some regions of interest (ROIs), where only in those areas there are relevant anomalies to be spotted. For these reasons, we propose a new architecture composed by two blocks. The first block is a Generative Adversarial Network (GAN), based on a residual autoencoder (ResAE), to perform reconstruction and denoising processes, while the second block produces image segmentation, spotting defects. This method learns from a dataset composed of good products and generated synthetic defects. The discriminative network is trained using a ROI for each image contained in the training dataset. The network will learn in which area anomalies are relevant. This approach guarantees the reduction of using pre-processing algorithms, formerly developed with blob-analysis and image-editing procedures. To test our model we used challenging MVTec anomaly detection datasets and an industrial large dataset of pharmaceutical BFS strips of vials. This set constitutes a more realistic use case of the aforementioned network.
- Abstract(参考訳): 異常検出は、近年、産業応用やプロセスでますます使われている。
装置の主な分野の1つは、表面異常検出のための視覚検査であり、これは規則性から逸脱する領域を特定し、結果として異常品を特定することを目的としている。
欠陥ローカライゼーションは重要なタスクであり、通常は生成された画像と元の画像の基本的な比較を使って達成され、いくつかのブロブ分析や画像編集アルゴリズムを実装します。
さらに、産業アプリケーションでは、画像の総量は必ずしも面白くないが、1つまたは一部の関心領域(ROI)になり得る。
これらの理由から,2ブロックからなる新しいアーキテクチャを提案する。
第1ブロックは残留オートエンコーダ(ResAE)に基づくGAN(Generative Adversarial Network)であり、再構成および復調処理を行う。
この方法は、優れた製品と生成された合成欠陥からなるデータセットから学習する。
識別ネットワークは、トレーニングデータセットに含まれる各画像のROIを使用してトレーニングされる。
ネットワークはどの領域の異常が関係しているかを学習する。
このアプローチは、以前はブロブ分析と画像編集の手順で開発された前処理アルゴリズムの使用を減らすことを保証する。
我々のモデルをテストするために、挑戦的なMVTec異常検出データセットと工業用BFSスニペットのBFSスニペットの大規模データセットを使用した。
このセットは前述のネットワークのより現実的なユースケースを構成する。
関連論文リスト
- Collaborative Reconstruction and Repair for Multi-class Industrial Anomaly Detection [37.057760207060554]
コラボレーティブ・リコンストラクション・アンド・リコンストラクション(CRR)は、リコンストラクションを修復に変換する。
我々は,デコーダからの表現が十分なローカル情報を含むことを保証するために,特徴レベルのランダムマスキングを実装した。
我々は,合成異常マスクによって教師されるセグメンテーションネットワークを訓練し,ローカライゼーション性能を向上させる。
論文 参考訳(メタデータ) (2025-12-12T09:24:23Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - ISSTAD: Incremental Self-Supervised Learning Based on Transformer for
Anomaly Detection and Localization [12.975540251326683]
本稿では,Transformerのバックボーンネットワークに基づく新しいアプローチを提案する。
通常の画像のみに基づいてMasked Autoencoder(MAE)モデルを訓練する。
その後の段階では、劣化した正規画像を生成するためにピクセルレベルのデータ拡張技術を適用する。
このプロセスにより、モデルは破損した領域の修復方法を学び、各ピクセルの状態を分類できる。
論文 参考訳(メタデータ) (2023-03-30T13:11:26Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。