Fugu-MT 論文翻訳(概要): DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation

論文の概要: DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation

arxiv url: http://arxiv.org/abs/2412.15570v1
Date: Fri, 20 Dec 2024 05:08:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 18:46:08.827655
Title: DefFiller: Mask-Conditioned Diffusion for Salient Steel Surface Defect Generation
Title（参考訳）: DefFiller: 表面欠陥発生のためのマスクによる拡散
Authors: Yichun Tai, Zhenzhen Huang, Tao Peng, Zhijiang Zhang,
Abstract要約: DefFillerは、レイアウト・ツー・イメージ拡散モデルを利用するマスク条件の欠陥生成手法である。得られたマスク条件に正確に適合する高品質な欠陥画像がDefFillerによって生成されることを示す。
参考スコア（独自算出の注目度）: 1.2362191015139727
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current saliency-based defect detection methods show promise in industrial settings, but the unpredictability of defects in steel production environments complicates dataset creation, hampering model performance. Existing data augmentation approaches using generative models often require pixel-level annotations, which are time-consuming and resource-intensive. To address this, we introduce DefFiller, a mask-conditioned defect generation method that leverages a layout-to-image diffusion model. DefFiller generates defect samples paired with mask conditions, eliminating the need for pixel-level annotations and enabling direct use in model training. We also develop an evaluation framework to assess the quality of generated samples and their impact on detection performance. Experimental results on the SD-Saliency-900 dataset demonstrate that DefFiller produces high-quality defect images that accurately match the provided mask conditions, significantly enhancing the performance of saliency-based defect detection models trained on the augmented dataset.
Abstract（参考訳）: 現在の正当性に基づく欠陥検出手法は, 産業環境において有望であるが, 鉄鋼生産環境における欠陥の予測不可能さは, データセット生成を複雑にし, モデル性能を阻害する。生成モデルを用いた既存のデータ拡張アプローチは、しばしば時間とリソース集約的なピクセルレベルのアノテーションを必要とする。この問題を解決するために,レイアウト・ツー・イメージ拡散モデルを利用したマスク条件欠陥生成手法であるDefFillerを導入する。 DefFillerは、マスク条件と組み合わせた欠陥サンプルを生成し、ピクセルレベルのアノテーションを不要にし、モデルトレーニングで直接使用できるようにする。また、生成したサンプルの品質と検出性能への影響を評価するための評価フレームワークを開発した。 SD-Saliency-900データセットの実験結果は、DefFillerが提供したマスク条件に正確に一致する高品質な欠陥画像を生成し、拡張データセットでトレーニングされた唾液ベースの欠陥検出モデルの性能を大幅に向上させることを示した。

関連論文リスト

Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文参考訳（メタデータ） (2025-10-03T14:00:32Z)
Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2025-06-03T09:29:47Z)
DefectFill: Realistic Defect Generation with Inpainting Diffusion Model for Visual Inspection [32.80355689164011]
DefectFillは、いくつかの参照欠陥画像のみを必要とする、現実的な欠陥生成のための新しい方法である。詳細でローカライズされた欠陥機能の正確なキャプチャと、欠陥のないオブジェクトへのシームレスな統合を可能にする。
論文参考訳（メタデータ） (2025-03-18T07:42:11Z)
DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文参考訳（メタデータ） (2025-01-21T18:56:41Z)
Epistemic Uncertainty for Generated Image Detection [107.62647907393377]
本稿では,創成モデルの時代において重要なセキュリティ問題に対処することを目的とした,てんかん不確実性によるAI生成画像検出のための新しいフレームワークを提案する。我々の重要な洞察は、トレーニングとテストデータの分布の相違が、機械学習モデルのエピステマティック不確実性空間に顕著に現れていることに起因している。
論文参考訳（メタデータ） (2024-12-08T11:32:25Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Bring the Power of Diffusion Model to Defect Detection [0.0]
拡散確率モデル(DDPM)は,特徴リポジトリとして構築する認知過程の特徴を抽出するために事前訓練される。待ち行列特徴を再構成してフィルタして高次元DDPM特徴を得る。実験結果から,本手法はいくつかの産業データセット上での競合的な結果が得られることが示された。
論文参考訳（メタデータ） (2024-08-25T14:28:49Z)
Leveraging Latent Diffusion Models for Training-Free In-Distribution Data Augmentation for Surface Defect Detection [9.784793380119806]
データ拡張のためのトレーニング不要な拡散型In-Distribution Anomaly GenerationパイプラインであるDIAGを紹介する。従来の画像生成技術とは異なり、我々は、ドメインの専門家がモデルにマルチモーダルガイダンスを提供する、Human-in-the-loopパイプラインを実装している。我々は、挑戦的なKSDD2データセットに対する最先端データ拡張アプローチに関して、DIAGの有効性と汎用性を実証する。
論文参考訳（メタデータ） (2024-07-04T14:28:52Z)
Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文参考訳（メタデータ） (2024-05-18T13:28:51Z)
Defect Image Sample Generation With Diffusion Prior for Steel Surface Defect Recognition [4.189885112658341]
既存の手法では、生成モデルを用いてサンプルを生成してデータセットを拡大する手法が検討されている。鋼表面欠陥画像生成のための安定拡散モデルに埋め込まれた膨大な生成分布を転送する安定表面欠陥生成(StableSDG)を提案する。我々は,鋼表面欠陥データセットの広範な実験を行い,高品質な試料の生成とトレーニング認識モデルに関する最先端性能を実証した。
論文参考訳（メタデータ） (2024-05-03T06:03:37Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文参考訳（メタデータ） (2023-12-10T05:13:40Z)
Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文参考訳（メタデータ） (2023-08-28T08:47:06Z)
DifFIQA: Face Image Quality Assessment Using Denoising Diffusion Probabilistic Models [1.217503190366097]
顔画像品質評価(FIQA)技術は、これらの性能劣化を軽減することを目的としている。拡散確率モデル(DDPM)に基づく強力な新しいFIQA手法DifFIQAを提案する。拡散に基づく摂動は計算コストが高いため、DifFIQA(R)と呼ばれる回帰ベースの品質予測器にDifFIQAで符号化された知識を蒸留する。
論文参考訳（メタデータ） (2023-05-09T21:03:13Z)
Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文参考訳（メタデータ） (2023-03-06T11:51:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。