論文の概要: Defect Image Sample Generation With Diffusion Prior for Steel Surface Defect Recognition
- arxiv url: http://arxiv.org/abs/2405.01872v1
- Date: Fri, 3 May 2024 06:03:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-06 13:35:25.962048
- Title: Defect Image Sample Generation With Diffusion Prior for Steel Surface Defect Recognition
- Title(参考訳): 鋼表面欠陥認識に先立って拡散した欠陥画像サンプル生成
- Authors: Yichun Tai, Kun Yang, Tao Peng, Zhenzhen Huang, Zhijiang Zhang,
- Abstract要約: 既存の手法では、生成モデルを用いてサンプルを生成してデータセットを拡大する手法が検討されている。
鋼表面欠陥画像生成のための安定拡散モデルに埋め込まれた膨大な生成分布を転送する安定表面欠陥生成(StableSDG)を提案する。
我々は,鋼表面欠陥データセットの広範な実験を行い,高品質な試料の生成とトレーニング認識モデルに関する最先端性能を実証した。
- 参考スコア(独自算出の注目度): 4.189885112658341
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of steel surface defect recognition is an industrial problem with great industry values. The data insufficiency is the major challenge in training a robust defect recognition network. Existing methods have investigated to enlarge the dataset by generating samples with generative models. However, their generation quality is still limited by the insufficiency of defect image samples. To this end, we propose Stable Surface Defect Generation (StableSDG), which transfers the vast generation distribution embedded in Stable Diffusion model for steel surface defect image generation. To tackle with the distinctive distribution gap between steel surface images and generated images of the diffusion model, we propose two processes. First, we align the distribution by adapting parameters of the diffusion model, adopted both in the token embedding space and network parameter space. Besides, in the generation process, we propose image-oriented generation rather than from pure Gaussian noises. We conduct extensive experiments on steel surface defect dataset, demonstrating state-of-the-art performance on generating high-quality samples and training recognition models, and both designed processes are significant for the performance.
- Abstract(参考訳): 鉄鋼表面欠陥認識の課題は産業価値の高い産業問題である。
データ不足は、堅牢な欠陥認識ネットワークをトレーニングする上での大きな課題である。
既存の手法では、生成モデルを用いてサンプルを生成してデータセットを拡大する手法が検討されている。
しかし、その生成品質は、欠陥画像サンプルの不足によって制限されている。
そこで本稿では, 鋼表面欠陥画像生成のための安定拡散モデルに埋め込まれた膨大な生成分布を転送する安定表面欠陥生成(StableSDG)を提案する。
鋼表面画像と拡散モデル生成画像の差分分布に対処するため, 2つのプロセスを提案する。
まず,拡散モデルのパラメータを適応させて分布を調整し,トークン埋め込み空間とネットワークパラメータ空間の両方に適用する。
また、生成過程において、純粋なガウス雑音からではなく、画像指向生成を提案する。
鋼表面欠陥データセットに関する広範囲な実験を行い,高品質な試料生成とトレーニング認識モデルにおける最先端性能を実証した。
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
大規模なデータセットのトレーニングによるスケーリングは、画像生成の品質と忠実度を高め、拡散モデルによる操作を可能にすることが示されている。
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
本研究は,異なる微調整方式と組み合わせた場合,様々なシナリオにおいて顕著な性能向上を示すものである。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation [1.2362191015139727]
DefFillerは、レイアウト・ツー・イメージ拡散モデルを利用するマスク条件の欠陥生成手法である。
得られたマスク条件に正確に適合する高品質な欠陥画像がDefFillerによって生成されることを示す。
論文 参考訳(メタデータ) (2024-12-20T05:08:42Z) - Generalized Diffusion Model with Adjusted Offset Noise [1.7767466724342067]
本稿では,厳密な確率的枠組みの中で自然に付加的な雑音を取り入れた一般化拡散モデルを提案する。
我々は、ある調整でノイズを相殺する理論的等価性を確立し、証拠の低い境界に基づいて損失関数を導出する。
合成データセットの実験により、我々のモデルは輝度に関する課題に効果的に対処し、高次元シナリオにおいて従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-12-04T08:57:03Z) - Bring the Power of Diffusion Model to Defect Detection [0.0]
拡散確率モデル(DDPM)は,特徴リポジトリとして構築する認知過程の特徴を抽出するために事前訓練される。
待ち行列特徴を再構成してフィルタして高次元DDPM特徴を得る。
実験結果から,本手法はいくつかの産業データセット上での競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-08-25T14:28:49Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Adv-Diffusion: Imperceptible Adversarial Face Identity Attack via Latent
Diffusion Model [61.53213964333474]
本稿では,生の画素空間ではなく,潜在空間における非知覚的対角的アイデンティティ摂動を生成できる統一的なフレームワークAdv-Diffusionを提案する。
具体的には,周囲のセマンティックな摂動を生成するために,個人性に敏感な条件付き拡散生成モデルを提案する。
設計された適応強度に基づく対向摂動アルゴリズムは、攻撃の伝達性とステルス性の両方を確保することができる。
論文 参考訳(メタデータ) (2023-12-18T15:25:23Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。