論文の概要: Large-Scale Universal Defect Generation: Foundation Models and Datasets
- arxiv url: http://arxiv.org/abs/2604.08915v1
- Date: Fri, 10 Apr 2026 03:21:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.661693
- Title: Large-Scale Universal Defect Generation: Foundation Models and Datasets
- Title(参考訳): 大規模ユニバーサルデフェクト生成:基礎モデルとデータセット
- Authors: Yuanting Fan, Jun Liu, Bin-Bin Gao, Xiaochen Chen, Yuhuan Lin, Zhewei Dai, Jiawei Zhan, Chengjie Wang,
- Abstract要約: 様々な領域にまたがる300Kの正規マスクカプセルの大規模データセットUDGを紹介する。
我々は,参照ベース欠陥生成とテキスト命令ベース欠陥編集の両方をサポートするユニバーサル欠陥生成基盤モデルUniDGを提案する。
MVTec-AD と VisA の実験では、UniDG は合成品質および下流の単クラスおよび複数クラスの異常検出/局所化において、前回の少数ショット異常発生および画像挿入/編集ベースラインより優れていた。
- 参考スコア(独自算出の注目度): 51.150071370083026
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing defect/anomaly generation methods often rely on few-shot learning, which overfits to specific defect categories due to the lack of large-scale paired defect editing data. This issue is aggravated by substantial variations in defect scale and morphology, resulting in limited generalization, degraded realism, and category consistency. We address these challenges by introducing UDG, a large-scale dataset of 300K normal-abnormal-mask-caption quadruplets spanning diverse domains, and by presenting UniDG, a universal defect generation foundation model that supports both reference-based defect generation and text instruction-based defect editing without per-category fine-tuning. UniDG performs Defect-Context Editing via adaptive defect cropping and structured diptych input format, and fuses reference and target conditions through MM-DiT multimodal attention. A two-stage training strategy, Diversity-SFT followed by Consistency-RFT, further improves diversity while enhancing realism and reference consistency. Extensive experiments on MVTec-AD and VisA show that UniDG outperforms prior few-shot anomaly generation and image insertion/editing baselines in synthesis quality and downstream single- and multi-class anomaly detection/localization. Code will be available at https://github.com/RetoFan233/UniDG.
- Abstract(参考訳): 既存の欠陥/異常生成方法は、大規模なペアリングされた欠陥編集データがないため、特定の欠陥カテゴリに過度に適合する、少数ショットの学習に依存することが多い。
この問題は、欠陥スケールとモルフォロジーのかなりのバリエーションによって増大し、その結果、限定的な一般化、劣化したリアリズム、カテゴリー整合性をもたらす。
様々な領域にまたがる300Kの正規マスクカプセルの大規模データセットUDGと、参照ベースの欠陥生成とテキスト命令ベースの欠陥編集の両方をサポートする普遍的な欠陥生成基盤モデルUniDGを導入することで、これらの課題に対処する。
UniDGは適応的欠陥トリミングと構造化ディプチッチ入力フォーマットによるDefect-Context Editingを実行し、MM-DiTマルチモーダルアテンションを通じて参照条件とターゲット条件を融合する。
2段階のトレーニング戦略であるDiversity-SFTとConsistency-RFTは、リアリズムと参照一貫性を高めながら多様性をさらに向上させる。
MVTec-AD と VisA の大規模な実験により、UniDG は合成品質および下流の単クラスおよび複数クラスの異常検出/局所化において、前回の少数ショット異常発生および画像挿入/編集ベースラインより優れていた。
コードはhttps://github.com/RetoFan233/UniDGで入手できる。
関連論文リスト
- Defect-aware Hybrid Prompt Optimization via Progressive Tuning for Zero-Shot Multi-type Anomaly Detection and Segmentation [12.030059666003972]
分散シフト下でのゼロショット多重型およびバイナリ異常検出とセグメンテーションのプログレッシブチューニングに基づく,Defect-aware Prompt Optimizationのための新しいアプローチであるDAPOを紹介する。
本手法は,固定されたテキストアンカーと学習可能なトークン埋め込みの両方で,ハイブリッドな欠陥認識プロンプトを学習することにより,異常関連画像特徴と対応するテキストセマンティクスを一致させる。
論文 参考訳(メタデータ) (2025-12-10T09:19:17Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - UniFault: A Fault Diagnosis Foundation Model from Bearing Data [23.797786758616223]
既存の機械故障診断モデルは、多種多様なデータセットにまたがる限定的な一般化を伴う操作特化である。
障害診断のための基盤モデルUniFaultを導入し,これらの問題に体系的に対処する。
UniFaultは、さまざまなFDデータセットにまたがる690万以上のサンプルに事前トレーニングされている。
論文 参考訳(メタデータ) (2025-04-02T05:34:27Z) - CNC: Cross-modal Normality Constraint for Unsupervised Multi-class Anomaly Detection [34.675120608542265]
本稿では,クラスに依存しない学習可能なプロンプトを利用して,デコードされた特徴を正規のテキスト表現へ導く手法を提案する。
本手法は,MVTec AD と VisA のデータセット上での競合性能を実現し,その性能を実証する。
論文 参考訳(メタデータ) (2024-12-31T08:43:44Z) - Fine-grained Abnormality Prompt Learning for Zero-shot Anomaly Detection [109.72772150095646]
FAPromptは、精密なZSADのためのきめ細かい異常プロンプトを学習するために設計された新しいフレームワークである。
産業的欠陥と医療的異常の両方をカバーする19の実世界のデータセットの実験は、FAPromptが画像レベルのZSADタスクとピクセルレベルのZSADタスクの両方で最先端の手法を大幅に上回っていることを実証している。
論文 参考訳(メタデータ) (2024-10-14T08:41:31Z) - DACAD: Domain Adaptation Contrastive Learning for Anomaly Detection in Multivariate Time Series [83.76994646443498]
時系列異常検出では、ラベル付きデータの不足が正確なモデルの開発に困難をもたらす。
時系列における異常検出のための新しいドメインコントラスト学習モデル(DACAD)を提案する。
本モデルでは,ソース領域に対する教師付きコントラスト損失と,ターゲット領域に対する自己監督型コントラスト型3重項損失を用いる。
論文 参考訳(メタデータ) (2024-04-17T11:20:14Z) - Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts [25.629973843455495]
Generalist Anomaly Detection (GAD)は、ターゲットデータにさらなるトレーニングを加えることなく、さまざまなアプリケーションドメインからさまざまなデータセットの異常を検出するために一般化可能な、単一の検出モデルをトレーニングすることを目的としている。
InCTRLと呼ばれるGADのための文脈内残差学習モデルを学習する新しい手法を提案する。
InCTRLは最高のパフォーマーであり、最先端の競合手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-11T08:07:46Z) - Diversity-Measurable Anomaly Detection [106.07413438216416]
本稿では,再構成の多様性を高めるため,DMAD(Diversity-Measurable Anomaly Detection)フレームワークを提案する。
PDMは基本的に、変形を埋め込みから分離し、最終的な異常スコアをより信頼性を高める。
論文 参考訳(メタデータ) (2023-03-09T05:52:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。