論文の概要: Synthetic Data for Object Classification in Industrial Applications
- arxiv url: http://arxiv.org/abs/2212.04790v1
- Date: Fri, 9 Dec 2022 11:43:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 15:21:15.540211
- Title: Synthetic Data for Object Classification in Industrial Applications
- Title(参考訳): 産業応用におけるオブジェクト分類のための合成データ
- Authors: August Baaz, Yonan Yonan, Kevin Hernandez-Diaz, Fernando
Alonso-Fernandez, Felix Nilsson
- Abstract要約: オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
- 参考スコア(独自算出の注目度): 53.180678723280145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the biggest challenges in machine learning is data collection.
Training data is an important part since it determines how the model will
behave. In object classification, capturing a large number of images per object
and in different conditions is not always possible and can be very
time-consuming and tedious. Accordingly, this work explores the creation of
artificial images using a game engine to cope with limited data in the training
dataset. We combine real and synthetic data to train the object classification
engine, a strategy that has shown to be beneficial to increase confidence in
the decisions made by the classifier, which is often critical in industrial
setups. To combine real and synthetic data, we first train the classifier on a
massive amount of synthetic data, and then we fine-tune it on real images.
Another important result is that the amount of real images needed for
fine-tuning is not very high, reaching top accuracy with just 12 or 24 images
per class. This substantially reduces the requirements of capturing a great
amount of real data.
- Abstract(参考訳): マシンラーニングの最大の課題のひとつは、データ収集だ。
モデルがどのように振る舞うかを決定するため、トレーニングデータは重要な部分です。
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも可能ではなく、非常に時間がかかり、面倒である。
そこで本研究では,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
我々は、実データと合成データを組み合わせて、オブジェクト分類エンジンを訓練する。これは、分類器による決定に対する信頼性を高めるために有益であることを示す戦略であり、しばしば産業設備において重要なものである。
実データと合成データを組み合わせるために、我々はまず大量の合成データに基づいて分類器を訓練し、次いで実画像で微調整する。
もう1つの重要な結果は、微調整に必要な実画像の量はそれほど高くなく、1クラスにつき12または24枚の画像で最高精度に達することである。
これにより、大量の実データを取得する必要が大幅に削減される。
関連論文リスト
- Data-Efficient Generation for Dataset Distillation [12.106527496044473]
ラベル付きリアルな合成画像を生成する条件付き潜時拡散モデルを訓練する。
我々は,少数の合成画像のみを用いてモデルを効果的に訓練し,大規模な実検体で評価できることを実証した。
論文 参考訳(メタデータ) (2024-09-05T22:31:53Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Scaling Laws of Synthetic Images for Model Training ... for Now [54.43596959598466]
本研究では, 合成画像のスケーリング法則について, テクスト・ツー・イメージ・モデルの現状から検討した。
合成画像は、CLIPトレーニングの実際の画像と似ているが、やや効果の低いスケーリング傾向を示す。
論文 参考訳(メタデータ) (2023-12-07T18:59:59Z) - Image Captions are Natural Prompts for Text-to-Image Models [70.30915140413383]
本研究では,合成データの学習効果とプロンプトによる合成データ分布の関係を解析した。
本稿では,テキストから画像への生成モデルにより,より情報的で多様な学習データを合成する簡易かつ効果的な手法を提案する。
本手法は,合成学習データに基づいて訓練したモデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-07-17T14:38:11Z) - Synthetic Image Data for Deep Learning [0.294944680995069]
3次元モデルからレンダリングされたリアルな合成画像データを使用して、画像集合を拡大し、画像分類セグメンテーションモデルを訓練することができる。
実車の生産3次元CADモデルに基づく大規模合成データセットを,高品質な物理ベースレンダリングとドメインランダム化により効率的に作成できることを示す。
論文 参考訳(メタデータ) (2022-12-12T20:28:13Z) - Analysis of Training Object Detection Models with Synthetic Data [0.0]
本稿では,オブジェクト検出に合成データを使用する方法の概要を概説する。
データ生成の側面とモデルをトレーニングするテクニックを分析します。
実験は実データ上で検証され、実データでトレーニングされたモデルにベンチマークされる。
論文 参考訳(メタデータ) (2022-11-29T10:21:16Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - PennSyn2Real: Training Object Recognition Models without Human Labeling [12.923677573437699]
我々はPennSyn2Realを提案する。20種類以上のマイクロエアロビー(MAV)の10万以上の4K画像からなる合成データセットである。
このデータセットは、MAV検出や分類などのハイレベルコンピュータビジョンタスクのための任意の数のトレーニングイメージを生成するために使用することができる。
このフレームワークを用いて生成された合成データは,検出やセグメンテーションといった一般的なオブジェクト認識タスクに対して,CNNモデルをトレーニングするために直接利用できることを示す。
論文 参考訳(メタデータ) (2020-09-22T02:53:40Z) - Can Synthetic Data Improve Object Detection Results for Remote Sensing
Images? [15.466412729455874]
本稿では,リモートセンシング画像航空機検出の性能向上のために,広域分布のリアルな合成データの利用を提案する。
レンダリング中に、インスタンスのサイズや背景画像のクラスなど、パラメータをランダムに設定します。
合成画像をよりリアルにするために,CycleGANと実際の未ラベル画像を用いて,画素レベルで合成画像を洗練する。
論文 参考訳(メタデータ) (2020-06-09T02:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。