論文の概要: Few-shot Defect Image Generation based on Consistency Modeling
- arxiv url: http://arxiv.org/abs/2408.00372v1
- Date: Thu, 1 Aug 2024 08:29:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-04 21:16:03.045454
- Title: Few-shot Defect Image Generation based on Consistency Modeling
- Title(参考訳): 一貫性モデリングに基づく欠陥画像生成
- Authors: Qingfeng Shi, Jing Wei, Fei Shen, Zhengtao Zhang,
- Abstract要約: DefectDiffuは、複数の製品にまたがる欠陥の一貫性をモデル化する、新しいテキスト誘導拡散法である。
DefectDiffuは、世代品質と多様性の点で最先端の手法を超越している。
- 参考スコア(独自算出の注目度): 1.8029094254659288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image generation can solve insufficient labeled data issues in defect detection. Most defect generation methods are only trained on a single product without considering the consistencies among multiple products, leading to poor quality and diversity of generated results. To address these issues, we propose DefectDiffu, a novel text-guided diffusion method to model both intra-product background consistency and inter-product defect consistency across multiple products and modulate the consistency perturbation directions to control product type and defect strength, achieving diversified defect image generation. Firstly, we leverage a text encoder to separately provide consistency prompts for background, defect, and fusion parts of the disentangled integrated architecture, thereby disentangling defects and normal backgrounds. Secondly, we propose the double-free strategy to generate defect images through two-stage perturbation of consistency direction, thereby controlling product type and defect strength by adjusting the perturbation scale. Besides, DefectDiffu can generate defect mask annotations utilizing cross-attention maps from the defect part. Finally, to improve the generation quality of small defects and masks, we propose the adaptive attention-enhance loss to increase the attention to defects. Experimental results demonstrate that DefectDiffu surpasses state-of-the-art methods in terms of generation quality and diversity, thus effectively improving downstream defection performance. Moreover, defect perturbation directions can be transferred among various products to achieve zero-shot defect generation, which is highly beneficial for addressing insufficient data issues. The code are available at https://github.com/FFDD-diffusion/DefectDiffu.
- Abstract(参考訳): 画像生成は欠陥検出におけるラベル付きデータの不十分な問題を解決することができる。
ほとんどの欠陥生成手法は、複数の製品間の相違を考慮せずに単一の製品上でのみ訓練され、結果の品質と多様性が低下する。
これらの問題に対処するために,複数製品にわたる製品内背景の一貫性と製品間欠陥の整合性の両方をモデル化し,製品タイプや欠陥強度を制御するための一貫性の摂動方向を調整し,多様な欠陥画像生成を実現するための新しいテキスト誘導拡散手法であるDefectDiffuを提案する。
まず、テキストエンコーダを利用して、アンタングル化されていない統合アーキテクチャの背景、欠陥、融合部分の一貫性プロンプトを個別に提供し、それによって欠陥と通常のバックグラウンドをアンタングル化する。
第2に,2段階の摂動方向の摂動により欠陥画像を生成する二重自由戦略を提案し,摂動スケールを調整して製品タイプと欠陥強度を制御する。
さらに、DefectDiffuは、欠陥部分から横断アテンションマップを利用した欠陥マスクアノテーションを生成することができる。
最後に,小さな欠陥やマスクの発生品質を向上させるため,欠陥に対する注意力を高めるために適応的な注意力損失を提案する。
実験結果から,DefectDiffuは生成品質と多様性の観点から最先端の手法を超越し,下流欠陥性能を効果的に向上することが示された。
さらに、欠陥摂動方向を様々な製品間で伝達してゼロショット欠陥発生を実現することで、不十分なデータ問題に対処する上で非常に有益である。
コードはhttps://github.com/FFDD-diffusion/DefectDiffuで入手できる。
関連論文リスト
- Change-Aware Siamese Network for Surface Defects Segmentation under Complex Background [0.6407952035735353]
変更検出フレームワークにおける欠陥セグメント化を解消する変更対応のSiameseネットワークを提案する。
トランスフォーマーベースのエンコーダを導くために,新しいマルチクラスのコントラスト損失を導入した。
距離マップで示される差分は、変更対応デコーダにスキップ接続され、クラス間およびクラス外の両方の欠陥の位置をアシストする。
論文 参考訳(メタデータ) (2024-09-01T02:48:11Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Progressive Alignment with VLM-LLM Feature to Augment Defect Classification for the ASE Dataset [7.1083241462091165]
従来の欠陥分類アプローチは2つの障壁に直面している。
不十分なトレーニングデータと不安定なデータ品質。
画像上に記録されたリッチなデータ記述を含む,欠陥分類のための特別なデータセットを提案するが,欠陥特徴を直接学習するのは困難である。
論文 参考訳(メタデータ) (2024-04-08T04:17:27Z) - DiffMAC: Diffusion Manifold Hallucination Correction for High Generalization Blind Face Restoration [62.44659039265439]
視覚障害者の視力回復を支援するための拡散情報拡散フレームワークを提案する。
DiffMACは、多種多様な劣化シーンと異種ドメインにおいて、高度な顔の復元を実現する。
結果は,最先端手法よりもDiffMACの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-15T08:44:15Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - CINFormer: Transformer network with multi-stage CNN feature injection
for surface defect segmentation [73.02218479926469]
表面欠陥分割のための多段CNN特徴注入を用いた変圧器ネットワークを提案する。
CINFormerは、入力画像のマルチレベルCNN機能をエンコーダ内のトランスフォーマーネットワークの異なるステージに注入する、シンプルだが効果的な機能統合機構を提供する。
さらに、CINFormerはTop-Kセルフアテンションモジュールを提供し、欠陥に関するより重要な情報を持つトークンにフォーカスする。
論文 参考訳(メタデータ) (2023-09-22T06:12:02Z) - Few-Shot Defect Image Generation via Defect-Aware Feature Manipulation [19.018561017953957]
そこで本研究では, 難易度の高いいくつかの症例において, 第一の欠陥画像生成法を提案する。
まず、欠陥のない画像をバックボーンとしてデータ効率の良いStyleGAN2をトレーニングする。
第二に、欠陥を意識した残留ブロックを背骨に取り付け、適切な欠陥マスクを生成することを学習する。
論文 参考訳(メタデータ) (2023-03-04T11:43:08Z) - Defect Transfer GAN: Diverse Defect Synthesis for Data Augmentation [4.559353193715442]
Defect Transfer GAN(DT-GAN)は、さまざまなバックグラウンド製品から独立した欠陥タイプを表現することを学ぶ。
MVTec ADと2つの追加データセットに関する実証研究は、DT-GANが最先端の画像合成法より優れていることを示した。
その結果, DT-GANによる拡張データにより, 少数のサンプル状態においても一貫した利得が得られることがわかった。
論文 参考訳(メタデータ) (2023-02-16T15:35:21Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - Defect-GAN: High-Fidelity Defect Synthesis for Automated Defect
Inspection [34.699695525216185]
Defect-GANは、現実的で多様な欠陥サンプルを生成する自動欠陥合成ネットワークです。
デフェメントと修復プロセスを通じて学習し、デフェメントは通常の表面画像に欠陥を生成する。
また、欠陥のバリエーションを模倣し、生成された欠陥の位置とカテゴリを柔軟に制御できます。
論文 参考訳(メタデータ) (2021-03-28T15:53:34Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。