論文の概要: MIRAGE: Model-agnostic Industrial Realistic Anomaly Generation and Evaluation for Visual Anomaly Detection
- arxiv url: http://arxiv.org/abs/2603.13507v1
- Date: Fri, 13 Mar 2026 18:36:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.248225
- Title: MIRAGE: Model-agnostic Industrial Realistic Anomaly Generation and Evaluation for Visual Anomaly Detection
- Title(参考訳): MIRAGE: モデルに依存しない産業的リアルな異常生成と視覚的異常検出のための評価
- Authors: Jinwei Hu, Francesco Borsatti, Arianna Stropeni, Davide Dalle Pezze, Manuel Barusco, Gian Antonio Susto,
- Abstract要約: MIRAGEは、リアルな異常画像生成とピクセルレベルのマスク生成のための完全に自動化されたパイプラインである。
当社のパイプラインでは,生成モデルをAPIコールを通じてブラックボックスとしてアクセスしています。
マスク生成を大規模に行うためには、軽量でトレーニング不要なデュアルブランチセマンティックチェンジ検出モジュールを導入する。
- 参考スコア(独自算出の注目度): 11.313360174738465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial visual anomaly detection (VAD) methods are typically trained on normal samples only, yet performance improves substantially when even limited anomalous data is available. Existing anomaly generation approaches either require real anomalous examples, demand expensive hardware, or produce synthetic defects that lack realism. We present MIRAGE (Model-agnostic Industrial Realistic Anomaly Generation and Evaluation), a fully automated pipeline for realistic anomalous image generation and pixel-level mask creation that requires no training and no anomalous images. Our pipeline accesses any generative model as a black box via API calls, uses a VLM for automatic defect prompt generation, and includes a CLIP-based quality filter to retain only well-aligned generated images. For mask generation at scale, we introduce a lightweight, training-free dual-branch semantic change detection module combining text-conditioned Grounding DINO features with fine-grained YOLOv26-Seg structural features. We benchmark four generation methods using Gemini 2.5 Flash Image (Nano Banana) as the generative backbone, evaluating performance on MVTec AD and VisA across two distinct tasks: (i) downstream anomaly segmentation and (ii) visual quality of the generated images, assessed via standard metrics (IS, IC-LPIPS) and a human perceptual study involving 31 participants and 1,550 pairwise votes. The results demonstrate that MIRAGE offers a scalable, accessible foundation for anomaly-aware industrial inspection that requires no real defect data. As a final contribution, we publicly release a large-scale dataset comprising 500 image-mask pairs per category for every MVTec AD and VisA class, over 13,000 pairs in total, alongside all generation prompts and pipeline code.
- Abstract(参考訳): 産業用視覚異常検出法(VAD)は通常、通常のサンプルのみで訓練されるが、限られた異常データであっても性能は大幅に向上する。
既存の異常生成アプローチは、実際の異常な例を必要とするか、高価なハードウェアを必要とするか、現実性に欠ける合成欠陥を生成するかのいずれかである。
MIRAGE(Model-Agnostic Industrial Realistic Anomaly Generation and Evaluation)は、リアルな異常画像生成と画素レベルのマスク生成のための完全自動化パイプラインであり、トレーニングを必要とせず、異常画像も不要である。
パイプラインはAPIコールを通じて生成モデルをブラックボックスとしてアクセスし、自動欠陥プロンプト生成にVLMを使用し、CLIPベースの品質フィルタを組み込んで、整列した生成画像のみを保持する。
マスク生成を大規模に行うために,テキストコンディショニングDINO機能とYOLOv26-Seg構造を併用した,軽量でトレーニング不要な2分岐意味変化検出モジュールを導入する。
Gemini 2.5 Flash Image (Nano Banana) を生成バックボーンとし、MVTec ADとVisAの性能を2つの異なるタスクで評価した。
(i)下流異常セグメンテーション
(i)標準指標(IS,IC-LPIPS)を用いて評価した生成画像の視覚的品質と,31人の参加者と1,550人の対決による人間の知覚調査を行った。
その結果,MIRAGEは異常データを必要としない産業検査のためのスケーラブルでアクセシブルな基盤を提供することを示した。
最後のコントリビューションとして、MVTec ADとVisAクラス毎に500のイメージマスクペアからなる大規模データセットを公開し、すべての生成プロンプトとパイプラインコードとともに合計13,000以上のペアを出力した。
関連論文リスト
- Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - SuperAD: A Training-free Anomaly Classification and Segmentation Method for CVPR 2025 VAND 3.0 Workshop Challenge Track 1: Adapt & Detect [17.160007050126403]
SuperADと命名されたDINOv2モデルを用いて特徴抽出に基づく完全トレーニング不要な異常検出とセグメンテーション手法を提案する。
本手法は,MVTec AD 2データセットの両テストセットの競合性を実現する。
論文 参考訳(メタデータ) (2025-05-26T09:29:27Z) - Component-aware Unsupervised Logical Anomaly Generation for Industrial Anomaly Detection [31.27483219228598]
異常検出は、製品の品質を確保し、自動化プロセスの効率を向上させるために、工業生産において重要である。
最近の生成モデルは、しばしば偽陽性を増大させる非現実的な異常を発生させるか、訓練のために現実世界の異常サンプルを必要とする。
本稿では,論理的異常生成のギャップに対処するコンポーネント・アウェアで教師なしのフレームワークであるComGENを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:54:43Z) - AssemAI: Interpretable Image-Based Anomaly Detection for Manufacturing Pipelines [0.0]
製造パイプラインにおける異常検出は、産業環境の複雑さと変動性によって強化され、依然として重要な課題である。
本稿では,スマート製造パイプラインに適した解釈可能な画像ベース異常検出システムAssemAIを紹介する。
論文 参考訳(メタデータ) (2024-08-05T01:50:09Z) - Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。