論文の概要: SynSur: An end-to-end generative pipeline for synthetic industrial surface defect generation and detection
- arxiv url: http://arxiv.org/abs/2604.26633v1
- Date: Wed, 29 Apr 2026 12:57:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.405438
- Title: SynSur: An end-to-end generative pipeline for synthetic industrial surface defect generation and detection
- Title(参考訳): SynSur: 合成表面欠陥の生成と検出のためのエンドツーエンド生成パイプライン
- Authors: Paul Julius Kühn, Mika Pommeranz, Arjan Kuijper, Saptarshi Neil Sinha,
- Abstract要約: 合成欠陥生成とアノテーションのためのエンドツーエンドパイプラインを提案する。
パイプラインの重要なステージを解析し、プロンプト構築、LoRA選択、サンプルフィルタリングを行う。
本報告では,拡散型産業欠陥合成のエンドツーエンド評価について述べる。
- 参考スコア(独自算出の注目度): 4.219862887901752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The bottleneck in learning-based industrial defect detection is often limited not by model capacity, but by the scarcity of labeled defect data: defects are rare, annotations are expensive, and collecting balanced training sets is slow. We present an end-to-end pipeline for synthetic defect generation and annotation, combining Vision-Language-Model-based prompts, LoRA-adapted diffusion, mask-guided inpainting, and sample filtering with automatic label derivation, and demonstrates the potential of real data with realistic synthetic samples to overcome data scarcity. The evaluation is conducted on, a challenging dataset of pitting defects on ball screw drives, and then on a subset of the Mobile phone screen surface defect segmentation dataset (MSD) dataset to test cross-domain transfer. Beyond downstream detector performance, we analyze key stages of the pipeline, including prompt construction, LoRA selection, and sample filtering with DreamSim and CLIPScore, to understand which synthetic samples are both realistic and useful. Experiments with YOLOv26, YOLOX, and LW-DETR show that synthetic-only training does not replace real data. When combined with real data, synthetic defects can preserve performance and yield modest gains in selected BSData training regimes. The MSD transfer study shows that the overall pipeline structure carries over to a second industrial inspection domain, while also highlighting the importance of domain-specific adaptation and annotation-quality control. Overall, the paper provides an end-to-end assessment of diffusion-based industrial defect synthesis and shows that its strongest value lies in strengthening scarce real datasets rather than substituting for them.
- Abstract(参考訳): 学習に基づく産業的欠陥検出のボトルネックは、しばしばモデルキャパシティではなく、ラベル付き欠陥データの不足によって制限される。
本稿では,視覚言語モデルに基づくプロンプト,LoRA適応拡散,マスク誘導インペインティング,および自動ラベル導出によるサンプルフィルタリングを組み合わせた合成欠陥生成とアノテーションのためのエンドツーエンドパイプラインを提案し,実際のデータの可能性を示し,データの不足を克服する。
この評価は、ボールスクリュードライブの穴あけ欠陥のデータセットと、携帯電話画面表面欠陥セグメンテーションデータセット(MSD)のサブセットを用いて、クロスドメイン転送をテストする。
下流検出器の性能以外にも、パイプラインの重要なステージを解析し、即時構築、LoRA選択、DreamSimとCLIPScoreによるサンプルフィルタリングを行い、どの合成サンプルが現実的かつ有用かを理解する。
YOLOv26、YOLOX、LW-DETRによる実験は、合成専用トレーニングが実際のデータを置き換えるものではないことを示している。
実データと組み合わせると、合成欠陥はパフォーマンスを保ち、選択されたBSDataトレーニングレギュレーションで適度な利得を得ることができる。
MSDトランスファー研究は、パイプライン構造全体が第2の産業検査ドメインに受け継がれる一方で、ドメイン固有の適応とアノテーション品質制御の重要性を強調していることを示している。
全体として,拡散に基づく工業的欠陥合成のエンドツーエンド評価を行い,その最大の価値は,その代替ではなく,少ない実データセットの強化にあることを示す。
関連論文リスト
- Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - AI-Generated Fall Data: Assessing LLMs and Diffusion Model for Wearable Fall Detection [3.5912245880418125]
転倒検知システムの訓練は、特に高齢者の実際の転倒データの不足により困難である。
本研究では,現実的な転倒シナリオのシミュレーションにおいて,テキスト・ツー・モーションモデルとテキスト・ツー・テキストモデルを評価する。
合成データセットを生成し、4つの実世界のベースラインデータセットと統合し、秋検出性能への影響を評価する。
論文 参考訳(メタデータ) (2025-05-07T02:30:33Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0]
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
実験により、少量の注入でも弱いラベル付き実欠陥が一般化を改善することが示されている。
論文 参考訳(メタデータ) (2025-03-06T21:56:31Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - PLASTIC: Improving Input and Label Plasticity for Sample Efficient
Reinforcement Learning [54.409634256153154]
強化学習(RL)では, サンプル効率の向上が重要である。
原則として、非政治的なRLアルゴリズムは、環境相互作用毎に複数の更新を可能にすることで、サンプル効率を向上させることができる。
本研究は, この現象の原因を, 塑性を2つの側面に分けて検討した。
論文 参考訳(メタデータ) (2023-06-19T06:14:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。