論文の概要: Hybrid Synthetic Data Generation with Domain Randomization Enables Zero-Shot Vision-Based Part Inspection Under Extreme Class Imbalance
- arxiv url: http://arxiv.org/abs/2512.00125v1
- Date: Fri, 28 Nov 2025 05:30:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.079797
- Title: Hybrid Synthetic Data Generation with Domain Randomization Enables Zero-Shot Vision-Based Part Inspection Under Extreme Class Imbalance
- Title(参考訳): ドメインランダム化によるハイブリッド合成データ生成による極クラス不均衡下でのゼロショットビジョンに基づく部分検査
- Authors: Ruo-Syuan Mei, Sixian Jia, Guangze Li, Soo Yeon Lee, Brian Musser, William Keller, Sreten Zakula, Jorge Arinez, Chenhui Shao,
- Abstract要約: 堅牢な機械学習モデルのトレーニングには、大量の高品質なラベル付きデータが必要である。
欠陥サンプルは本質的に稀であり、モデル性能を低下させる深刻なクラス不均衡を引き起こす。
合成データ生成は、大きく、バランスよく、完全に注釈付けされたデータセットの作成を可能にすることで、有望なソリューションを提供する。
- 参考スコア(独自算出の注目度): 3.7696918637188817
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning, particularly deep learning, is transforming industrial quality inspection. Yet, training robust machine learning models typically requires large volumes of high-quality labeled data, which are expensive, time-consuming, and labor-intensive to obtain in manufacturing. Moreover, defective samples are intrinsically rare, leading to severe class imbalance that degrades model performance. These data constraints hinder the widespread adoption of machine learning-based quality inspection methods in real production environments. Synthetic data generation (SDG) offers a promising solution by enabling the creation of large, balanced, and fully annotated datasets in an efficient, cost-effective, and scalable manner. This paper presents a hybrid SDG framework that integrates simulation-based rendering, domain randomization, and real background compositing to enable zero-shot learning for computer vision-based industrial part inspection without manual annotation. The SDG pipeline generates 12,960 labeled images in one hour by varying part geometry, lighting, and surface properties, and then compositing synthetic parts onto real image backgrounds. A two-stage architecture utilizing a YOLOv8n backbone for object detection and MobileNetV3-small for quality classification is trained exclusively on synthetic data and evaluated on 300 real industrial parts. The proposed approach achieves an mAP@0.5 of 0.995 for detection, 96% classification accuracy, and 90.1% balanced accuracy. Comparative evaluation against few-shot real-data baseline approaches demonstrates significant improvement. The proposed SDG-based approach achieves 90-91% balanced accuracy under severe class imbalance, while the baselines reach only 50% accuracy. These results demonstrate that the proposed method enables annotation-free, scalable, and robust quality inspection for real-world manufacturing applications.
- Abstract(参考訳): 機械学習、特にディープラーニングは、産業品質検査を変革している。
しかし、堅牢な機械学習モデルのトレーニングには、一般的に大量の高品質なラベル付きデータが必要です。
さらに、欠陥サンプルは本質的に稀であり、モデル性能を低下させる深刻なクラス不均衡を引き起こす。
これらのデータ制約は、実運用環境における機械学習ベースの品質検査手法の普及を妨げている。
合成データ生成(SDG)は、大規模でバランスの取れた完全な注釈付きデータセットを、効率的で費用対効果が高く、スケーラブルな方法で作成可能にすることで、有望なソリューションを提供する。
本稿では、シミュレーションベースのレンダリング、ドメインランダム化、実背景合成を統合したハイブリッドSDGフレームワークについて、手動のアノテーションを使わずに、コンピュータビジョンベースの産業部品検査のためのゼロショット学習を実現する。
SDGパイプラインは1時間で12,960個のラベル付き画像を生成する。
YOLOv8nのバックボーンをオブジェクト検出に利用し,MobileNetV3-smallを品質分類に使用した2段階アーキテクチャを,合成データのみに基づいてトレーニングし,300個の実産業部品で評価した。
提案手法は、検出のためのmAP@0.5の0.995、分類精度96%、バランス精度90.1%を達成する。
数ショットのリアルタイムベースラインアプローチに対する比較評価は、大幅な改善を示している。
提案手法は, 厳密なクラス不均衡下で90~91%のバランス精度を達成し, ベースラインの精度は50%に留まった。
これらの結果から,本手法は実世界の製造アプリケーションに対して,アノテーションのない,スケーラブルで,堅牢な品質検査を可能にすることを示した。
関連論文リスト
- Synthetic Industrial Object Detection: GenAI vs. Feature-Based Methods [5.278929538141005]
我々は、特徴ベースの手法、生成AI(GenAI)、古典的なレンダリングアプローチを含む、ドメインランダム化(DR)およびドメイン適応(DA)テクニックをベンチマークする。
本評価では,低レベルの特徴アライメントと高レベルの特徴アライメントの有効性,および実世界の文脈から生成されたプロンプトによって誘導される拡散に基づくDA法について検討する。
その結果、十分な可変性を持つレンダリングベースデータが、輝度ベースや知覚的ハッシュフィルタリングといったよりシンプルな特徴ベースのメソッドとして利用可能である場合、精度と資源効率の両方においてより複雑なGenAIベースのアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-11-28T14:51:08Z) - A Contrastive Learning-Guided Confident Meta-learning for Zero Shot Anomaly Detection [17.73056562717683]
CoZADは、新しいゼロショット異常検出フレームワークである。
ソフト・インテリジェンス・ラーニングとメタラーニングとコントラスト的特徴表現を統合している。
7つの産業ベンチマークのうち6つで既存の手法を上回ります。
論文 参考訳(メタデータ) (2025-08-25T09:27:31Z) - Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。
本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。
経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文 参考訳(メタデータ) (2025-06-20T00:17:14Z) - Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models [6.932314083921248]
本稿では, 標準RGB画像, コスト効率のよいセンシングモダリティを, 自動化システムにおける重要な前処理タスクに利用することを検討する。
本稿では,コンベアベルト構成のためのコンピュータビジョンコンポーネントについて,(a)4種類の一般的な織物の分類と,(b)ボタンやジッパーなどの非繊維の特徴のセグメンテーションを行う。
論文 参考訳(メタデータ) (2025-06-06T22:49:53Z) - Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文 参考訳(メタデータ) (2025-03-10T17:44:46Z) - Accelerating Domain-Aware Electron Microscopy Analysis Using Deep Learning Models with Synthetic Data and Image-Wide Confidence Scoring [0.0]
我々は物理に基づく合成画像とデータ生成装置を作成し、その結果、同等の精度(0.86)、リコール(0.63)、F1スコア(0.71)、エンジニアリング特性予測(R2=0.82)を実現する機械学習モデルを得た。
本研究は,合成データがMLの人間依存を排除し,画像毎に多くの特徴を検出する必要がある場合に,ドメイン認識の手段を提供することを示す。
論文 参考訳(メタデータ) (2024-08-02T20:15:15Z) - Rare Class Prediction Model for Smart Industry in Semiconductor Manufacturing [1.3955252961896323]
本研究では, 半導体製造プロセスから収集したIn situデータに対して, 希少なクラス予測手法を開発した。
第一の目的は、ノイズとクラス不均衡の問題に対処し、クラス分離を強化するモデルを構築することである。
ROC曲線はAUCが0.95、精度が0.66、リコールが0.96である。
論文 参考訳(メタデータ) (2024-06-06T22:09:43Z) - Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.65123150513683]
CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-15T17:33:49Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。