論文の概要: Controllable Image Synthesis of Industrial Data Using Stable Diffusion
- arxiv url: http://arxiv.org/abs/2401.03152v1
- Date: Sat, 6 Jan 2024 08:09:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 20:09:50.790086
- Title: Controllable Image Synthesis of Industrial Data Using Stable Diffusion
- Title(参考訳): 安定拡散を用いた産業データの制御可能な画像合成
- Authors: Gabriele Valvano, Antonino Agostino, Giovanni De Magistris, Antonino
Graziano, Giacomo Veneri
- Abstract要約: 本稿では,産業データに基づく汎用事前学習型生成モデルの再利用手法を提案する。
まず、モデルに新しい概念を学習させ、新しいデータ分布を学習させる。
そこで我々は,その生成過程の条件付けを強制的に行ない,よく定義されたトポロジ的特徴を満たす産業用画像を生成する。
- 参考スコア(独自算出の注目度): 2.021800129069459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training supervised deep neural networks that perform defect detection and
segmentation requires large-scale fully-annotated datasets, which can be hard
or even impossible to obtain in industrial environments. Generative AI offers
opportunities to enlarge small industrial datasets artificially, thus enabling
the usage of state-of-the-art supervised approaches in the industry.
Unfortunately, also good generative models need a lot of data to train, while
industrial datasets are often tiny. Here, we propose a new approach for reusing
general-purpose pre-trained generative models on industrial data, ultimately
allowing the generation of self-labelled defective images. First, we let the
model learn the new concept, entailing the novel data distribution. Then, we
force it to learn to condition the generative process, producing industrial
images that satisfy well-defined topological characteristics and show defects
with a given geometry and location. To highlight the advantage of our approach,
we use the synthetic dataset to optimise a crack segmentor for a real
industrial use case. When the available data is small, we observe considerable
performance increase under several metrics, showing the method's potential in
production environments.
- Abstract(参考訳): 欠陥検出とセグメンテーションを実行するための教師付きディープニューラルネットワークのトレーニングには、大規模で完全なアノテートされたデータセットが必要である。
生成AIは、小さな産業データセットを人工的に拡大する機会を提供する。
残念なことに、優れた生成モデルにはトレーニングに大量のデータが必要です。
そこで本稿では,産業データの汎用学習型生成モデルを再利用し,最終的に自己ラベル欠陥画像の生成を可能にする新しい手法を提案する。
まず、モデルに新しい概念を学習させ、新しいデータ分布を伴わせます。
次に, 生成過程の条件を学習させ, 適切に定義された位相特性を満足し, 所定の形状と位置で欠陥を示す工業的画像を生成する。
提案手法の利点を強調するため, 実産業用ケースのクラックセグメンタを最適化するために, 合成データセットを用いた。
利用可能なデータが少なければ、いくつかのメトリクスでかなりのパフォーマンス向上を観測し、本運用環境におけるメソッドの可能性を示す。
関連論文リスト
- Fractals as Pre-training Datasets for Anomaly Detection and Localization [0.0]
異常検出は、欠陥部分の検出とローカライズを支援するため、大規模製造業において不可欠である。
大規模データセットの事前トレーニング機能抽出は、このタスクの一般的なアプローチである。
動的に生成されたフラクタル画像を用いて事前学習した8つの最先端手法の性能を評価する。
論文 参考訳(メタデータ) (2024-05-11T10:35:42Z) - IPAD: Industrial Process Anomaly Detection Dataset [71.39058003212614]
ビデオ異常検出(VAD)は,ビデオフレーム内の異常を認識することを目的とした課題である。
本稿では,産業シナリオにおけるVADに特化して設計された新しいデータセットIPADを提案する。
このデータセットは16の異なる産業用デバイスをカバーし、合成ビデオと実世界のビデオの両方を6時間以上保存している。
論文 参考訳(メタデータ) (2024-04-23T13:38:01Z) - Investigation of the Impact of Synthetic Training Data in the Industrial
Application of Terminal Strip Object Detection [4.327763441385371]
本稿では,端末ストリップ物体検出の複雑な産業応用における標準対象検出器のシム・トゥ・リアル一般化性能について検討する。
評価のために300個の実画像に手動でアノテートを行った結果,どちらの領域でも同じ規模の興味の対象が重要であることがわかった。
論文 参考訳(メタデータ) (2024-03-06T18:33:27Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Segmenting Unseen Industrial Components in a Heavy Clutter Using RGB-D
Fusion and Synthetic Data [0.4724825031148411]
産業コンポーネントはテクスチャレスで反射性があり、乱雑で非構造的な環境でよく見られる。
本稿では,テクスチャをランダム化して形状情報にフォーカスする合成データ生成パイプラインを提案する。
信頼性マップ推定器を備えたRGB-D Fusion Mask R-CNNも提案する。
論文 参考訳(メタデータ) (2020-02-10T02:33:21Z) - Forecasting Industrial Aging Processes with Machine Learning Methods [0.0]
我々は、従来のステートレスモデルとより複雑なリカレントニューラルネットワークを比較して、幅広いデータ駆動モデルを評価する。
以上の結果から,リカレントモデルでは,より大きなデータセットでトレーニングした場合,ほぼ完璧な予測が得られた。
論文 参考訳(メタデータ) (2020-02-05T13:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。