論文の概要: Analysis of Training Object Detection Models with Synthetic Data
- arxiv url: http://arxiv.org/abs/2211.16066v1
- Date: Tue, 29 Nov 2022 10:21:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 14:51:17.646129
- Title: Analysis of Training Object Detection Models with Synthetic Data
- Title(参考訳): 合成データを用いた訓練対象検出モデルの解析
- Authors: Bram Vanherle, Steven Moonen, Frank Van Reeth, Nick Michiels
- Abstract要約: 本稿では,オブジェクト検出に合成データを使用する方法の概要を概説する。
データ生成の側面とモデルをトレーニングするテクニックを分析します。
実験は実データ上で検証され、実データでトレーニングされたモデルにベンチマークされる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, the use of synthetic training data has been on the rise as it
offers correctly labelled datasets at a lower cost. The downside of this
technique is that the so-called domain gap between the real target images and
synthetic training data leads to a decrease in performance. In this paper, we
attempt to provide a holistic overview of how to use synthetic data for object
detection. We analyse aspects of generating the data as well as techniques used
to train the models. We do so by devising a number of experiments, training
models on the Dataset of Industrial Metal Objects (DIMO). This dataset contains
both real and synthetic images. The synthetic part has different subsets that
are either exact synthetic copies of the real data or are copies with certain
aspects randomised. This allows us to analyse what types of variation are good
for synthetic training data and which aspects should be modelled to closely
match the target data. Furthermore, we investigate what types of training
techniques are beneficial towards generalisation to real data, and how to use
them. Additionally, we analyse how real images can be leveraged when training
on synthetic images. All these experiments are validated on real data and
benchmarked to models trained on real data. The results offer a number of
interesting takeaways that can serve as basic guidelines for using synthetic
data for object detection. Code to reproduce results is available at
https://github.com/EDM-Research/DIMO_ObjectDetection.
- Abstract(参考訳): 近年,正確なラベル付きデータセットを低コストで提供するため,合成トレーニングデータの利用が増加している。
この手法の欠点は、実際の対象画像と合成トレーニングデータとの間のいわゆるドメインギャップが、パフォーマンスの低下につながることだ。
本稿では,オブジェクト検出のための合成データの使い方に関する総括的概要を提供する。
私たちは、データ生成の側面と、モデルのトレーニングに使用されるテクニックを分析します。
私たちは、多くの実験を考案し、産業金属オブジェクトのデータセット(DIMO)でモデルをトレーニングします。
このデータセットは、実画像と合成画像の両方を含んでいる。
合成部は、実データの正確な合成コピーである、あるいは特定のアスペクトをランダム化したコピーである、異なるサブセットを有する。
これにより、合成トレーニングデータにどのようなバリエーションが良いのか、ターゲットデータと密にマッチするようにどのアスペクトをモデル化すべきかを分析できる。
さらに,実データへの一般化にどのような訓練手法が有用か,その利用方法について検討した。
さらに,合成画像のトレーニングにおいて実画像をどのように活用できるかを分析する。
これらの実験はすべて実データ上で検証され、実データでトレーニングされたモデルにベンチマークされる。
この結果は、オブジェクト検出に合成データを使用するための基本的なガイドラインとして役立つ、興味深い多くのテイクアウトを提供する。
結果を再現するコードはhttps://github.com/EDM-Research/DIMO_ObjectDetectionで公開されている。
関連論文リスト
- Exploring the Potential of Synthetic Data to Replace Real Data [16.89582896061033]
実データを置き換えるための合成データのポテンシャルは、ドメイン間の実画像の数や、トレーニングされたモデルを評価するためのテストセットによって異なることがわかった。
train2test 距離と $textAP_textt2t$ という2つの新しい指標を導入し、合成データを用いたクロスドメイントレーニングセットの性能を評価する。
論文 参考訳(メタデータ) (2024-08-26T18:20:18Z) - Improving Object Detector Training on Synthetic Data by Starting With a Strong Baseline Methodology [0.14980193397844666]
本稿では,合成データを用いた学習における事前学習対象検出器の性能向上手法を提案する。
提案手法は,実画像の事前学習から得られた有用な特徴を忘れずに,合成データから有能な情報を抽出することに焦点を当てる。
論文 参考訳(メタデータ) (2024-05-30T08:31:01Z) - Object Detector Differences when using Synthetic and Real Training Data [0.0]
都市環境からの実画像と合成画像に基づいてYOLOv3オブジェクト検出器を訓練する。
本研究では,CKA(Centered Kernel Alignment)を用いた類似性解析を行い,合成データに対する学習効果について検討する。
その結果、実データで訓練された検出器と合成データで訓練された検出器との最大の類似性は初期の層にあり、最も大きな違いは頭部にあることがわかった。
論文 参考訳(メタデータ) (2023-12-01T16:27:48Z) - Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。
このようなモデルは大きい傾向があり、訓練データの総量を必要とする。
人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。
このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文 参考訳(メタデータ) (2023-11-02T01:51:43Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - The Big Data Myth: Using Diffusion Models for Dataset Generation to
Train Deep Detection Models [0.15469452301122172]
本研究では, 微調整型安定拡散モデルによる合成データセット生成のための枠組みを提案する。
本研究の結果から, 合成データを用いた物体検出モデルは, ベースラインモデルと同じような性能を示すことが明らかとなった。
論文 参考訳(メタデータ) (2023-06-16T10:48:52Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Dataset Distillation by Matching Training Trajectories [75.9031209877651]
そこで本研究では,実データと同じような状態にネットワークを誘導するために,蒸留データを最適化する新しい定式化を提案する。
ネットワークが与えられたら、蒸留データを何回か繰り返して訓練し、合成訓練されたパラメータと実データで訓練されたパラメータとの距離に関して蒸留データを最適化する。
本手法は既存の手法よりも優れており,高解像度の視覚データを蒸留することができる。
論文 参考訳(メタデータ) (2022-03-22T17:58:59Z) - Towards 3D Scene Understanding by Referring Synthetic Models [65.74211112607315]
メソッドは通常、実際のシーンスキャンにおける過剰なアノテーションを緩和する。
合成モデルは、合成特徴の実際のシーンカテゴリを、統一された特徴空間にどのように依存するかを考察する。
実験の結果,ScanNet S3DISデータセットの平均mAPは46.08%,学習データセットは55.49%であった。
論文 参考訳(メタデータ) (2022-03-20T13:06:15Z) - Synthetic Data for Model Selection [2.4499092754102874]
合成データはモデル選択に有用であることを示す。
そこで本研究では,実領域に適合する合成誤差推定をキャリブレーションする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T09:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。