論文の概要: Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map
- arxiv url: http://arxiv.org/abs/2505.03623v1
- Date: Tue, 06 May 2025 15:21:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.448393
- Title: Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map
- Title(参考訳): 産業画像とセグメンテーションマップの合成のためのバウンディングボックスガイド拡散
- Authors: Alessandro Simoni, Francesco Pelosin,
- Abstract要約: 最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
- 参考スコア(独自算出の注目度): 50.21082069320818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic dataset generation in Computer Vision, particularly for industrial applications, is still underexplored. Industrial defect segmentation, for instance, requires highly accurate labels, yet acquiring such data is costly and time-consuming. To address this challenge, we propose a novel diffusion-based pipeline for generating high-fidelity industrial datasets with minimal supervision. Our approach conditions the diffusion model on enriched bounding box representations to produce precise segmentation masks, ensuring realistic and accurately localized defect synthesis. Compared to existing layout-conditioned generative methods, our approach improves defect consistency and spatial accuracy. We introduce two quantitative metrics to evaluate the effectiveness of our method and assess its impact on a downstream segmentation task trained on real and synthetic data. Our results demonstrate that diffusion-based synthesis can bridge the gap between artificial and real-world industrial data, fostering more reliable and cost-efficient segmentation models. The code is publicly available at https://github.com/covisionlab/diffusion_labeling.
- Abstract(参考訳): コンピュータビジョンにおける合成データセット生成、特に産業アプリケーションについては、まだ未調査である。
例えば、産業欠陥のセグメンテーションは、非常に正確なラベルを必要とするが、そのようなデータを取得するのはコストと時間を要する。
この課題に対処するために、最小限の監督で高忠実度産業データセットを生成するための拡散に基づく新しいパイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 精度の高いセグメンテーションマスクを作製し, 現実的かつ正確に局所化された欠陥合成を保証する。
既存のレイアウト条件付き生成手法と比較して,本手法は欠陥の整合性と空間的精度を向上させる。
本稿では,本手法の有効性を評価し,実データおよび合成データに基づいて学習した下流セグメンテーションタスクへの影響を評価するための2つの定量的指標を提案する。
以上の結果から, 拡散合成は, 人工的および実世界の産業データ間のギャップを埋め, より信頼性が高く, コスト効率の高いセグメンテーションモデルを促進することが示唆された。
コードはhttps://github.com/covisionlab/diffusion_labeling.comで公開されている。
関連論文リスト
- ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0]
産業用スクリーン印刷異常検出データセット(ISP-AD)
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
合成および実際の欠陥を取り入れた複合教師あり訓練手法の実験を行った。
研究結果は, 偽陽性率の低い, 高いリコールなどの産業検査要求を満たすことによって, 合成的, 蓄積的両欠陥による監督が相互に補完できることを示唆している。
論文 参考訳(メタデータ) (2025-03-06T21:56:31Z) - DreamDA: Generative Data Augmentation with Diffusion Models [68.22440150419003]
本稿では,新しい分類指向フレームワークDreamDAを提案する。
DreamDAは、オリジナルのデータのトレーニングイメージを種として考慮して、オリジナルのデータ分布に準拠する多様なサンプルを生成する。
また、生成したデータのラベルは、対応するシード画像のラベルと一致しない可能性があるため、擬似ラベルを生成するための自己学習パラダイムを導入する。
論文 参考訳(メタデータ) (2024-03-19T15:04:35Z) - Controllable Image Synthesis of Industrial Data Using Stable Diffusion [2.021800129069459]
本稿では,産業データに基づく汎用事前学習型生成モデルの再利用手法を提案する。
まず、モデルに新しい概念を学習させ、新しいデータ分布を学習させる。
そこで我々は,その生成過程の条件付けを強制的に行ない,よく定義されたトポロジ的特徴を満たす産業用画像を生成する。
論文 参考訳(メタデータ) (2024-01-06T08:09:24Z) - VisDA 2022 Challenge: Domain Adaptation for Industrial Waste Sorting [61.52419223232737]
産業廃棄物の選別において、最も大きな課題の1つは入力ストリームの極端な多様性である。
産業廃棄物浄化における領域適応に関するVisDA 2022の課題について紹介する。
論文 参考訳(メタデータ) (2023-03-26T21:38:38Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Segmenting Unseen Industrial Components in a Heavy Clutter Using RGB-D
Fusion and Synthetic Data [0.4724825031148411]
産業コンポーネントはテクスチャレスで反射性があり、乱雑で非構造的な環境でよく見られる。
本稿では,テクスチャをランダム化して形状情報にフォーカスする合成データ生成パイプラインを提案する。
信頼性マップ推定器を備えたRGB-D Fusion Mask R-CNNも提案する。
論文 参考訳(メタデータ) (2020-02-10T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。