論文の概要: MAGIC: Mask-Guided Diffusion Inpainting with Multi-Level Perturbations and Context-Aware Alignment for Few-Shot Anomaly Generation
- arxiv url: http://arxiv.org/abs/2507.02314v1
- Date: Thu, 03 Jul 2025 04:54:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:15.674892
- Title: MAGIC: Mask-Guided Diffusion Inpainting with Multi-Level Perturbations and Context-Aware Alignment for Few-Shot Anomaly Generation
- Title(参考訳): Mask-Guided Diffusion Inpainting with Multi-Level Perturbations and Context-Aware Asignment for Few-Shot Anomaly Generation (MRIC)
- Authors: JaeHyuck Choi, MinJun Kim, JeHyeong Hong,
- Abstract要約: 産業品質管理設定において, 少ない異常データを増大させるための実用的なソリューションとして, ショット異常生成が出現している。
マルチレベル摂動とコンテキスト認識アライメントを備えたMAGIC-Mask-Guided Inpaintingを提案する。
MAGICは、下流の異常なタスクにおいて、過去の最先端のタスクより優れています。
- 参考スコア(独自算出の注目度): 4.773905705768453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot anomaly generation is emerging as a practical solution for augmenting the scarce anomaly data in industrial quality control settings. An ideal generator would meet three demands at once, namely (i) keep the normal background intact, (ii) inpaint anomalous regions to tightly overlap with the corresponding anomaly masks, and (iii) generate anomalous regions in a semantically valid location, while still producing realistic, diverse appearances from only a handful of real examples. Existing diffusion-based methods usually satisfy at most two of these requirements: global anomaly generators corrupt the background, whereas mask-guided ones often falter when the mask is imprecise or misplaced. We propose MAGIC--Mask-guided inpainting with multi-level perturbations and Context-aware alignment--to resolve all three issues. At its core, MAGIC fine-tunes a Stable Diffusion inpainting backbone that preserves normal regions and ensures strict adherence of the synthesized anomaly to the supplied mask, directly addressing background corruption and misalignment. To offset the diversity loss that fine-tuning can cause, MAGIC adds two complementary perturbation strategies: (i) Gaussian prompt-level perturbation applied during fine-tuning and inference that broadens the global appearance of anomalies while avoiding low-fidelity textual appearances, and (ii) mask-guided spatial noise injection that enriches local texture variations. Additionally, the context-aware mask alignment module forms semantic correspondences and relocates masks so that every anomaly remains plausibly contained within the host object, eliminating out-of-boundary artifacts. Under a consistent identical evaluation protocol on the MVTec-AD dataset, MAGIC outperforms previous state-of-the-arts in downstream anomaly tasks.
- Abstract(参考訳): 産業品質管理設定において, 少ない異常データを増大させるための実用的なソリューションとして, ショット異常生成が出現している。
理想的な発電機は3つの要求を同時に満たす。
(i)通常の背景をそのままにしておく。
(二)対応する異常マスクと密に重複する異常領域を塗布し、
三 意味論的に有効な場所で異常な領域を生成しつつ、少数の実例から現実的で多様な外観を創出する。
既存の拡散法は通常、これらの要件の少なくとも2つを満たす: グローバルな異常発生器は背景を破損するが、マスクが不正確または誤配置された場合、マスク誘導装置はしばしば混乱する。
MRIC-Mask-Guided Inpainting with multi-level perturbation and Context-aware alignment--- to resolve all three issues。
MAGICは、正常な領域を保ち、合成された異常を供給されたマスクに厳密に付着させることで、背景の腐敗や不整合に直接対処する安定拡散を塗布するバックボーンを微調整する。
微調整がもたらす多様性損失を相殺するために、MAGICは2つの相補的摂動戦略を追加した。
一 微調整及び推論中に適用されたガウス的急激な摂動で、低忠実性テキストの出現を回避しつつ、異常のグローバルな出現を拡大し、
(II)局所的なテクスチャ変化を増大させるマスク誘導型空間ノイズ注入。
さらに、コンテキスト対応マスクアライメントモジュールはセマンティック対応を形成し、マスクをリロケーションすることで、すべての異常がホストオブジェクト内に確実に保持され、境界外アーティファクトが排除される。
MVTec-ADデータセット上の一貫した同一評価プロトコルの下で、MAGICは、下流異常タスクにおいて、過去の最先端タスクより優れている。
関連論文リスト
- Bi-Grid Reconstruction for Image Anomaly Detection [0.0]
本稿では,textbfGRAD: Bi-textbfGrid textbfReconstruction for Image textbfAnomaly textbfDetectionを紹介する。
2つの連続格子を用いて、正常な視点と異常な視点の両方から異常検出を強化する。
全体的な精度と微妙な違いを識別し、既存の方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-01T10:06:38Z) - Dual-Interrelated Diffusion Model for Few-Shot Anomaly Image Generation [22.164957586513776]
製造業における異常検査の性能は異常データの不足によって制約される。
本稿では,新しい拡散型少数ショット画像生成モデルであるDualAnoDiffを提案する。
提案手法は,異常検出,異常局所化,異常分類タスクなど,下流異常検査タスクの性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-08-24T08:09:32Z) - GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Self-Supervised Masking for Unsupervised Anomaly Detection and
Localization [22.671913403500728]
本研究では,ランダムマスキングと復元による自己教師あり学習手法を提案し,SSM(Self-Supervised Masking)と名づけた。
SSMは、塗布ネットワークのトレーニングを強化するだけでなく、推測時のマスク予測の効率を大幅に向上させる。
推論における異常検出と局所化の効率と有効性を改善するために,新しいプログレッシブマスク改良手法を提案する。
論文 参考訳(メタデータ) (2022-05-13T11:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。