論文の概要: PennSyn2Real: Training Object Recognition Models without Human Labeling
- arxiv url: http://arxiv.org/abs/2009.10292v2
- Date: Fri, 16 Oct 2020 04:58:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 22:32:56.761987
- Title: PennSyn2Real: Training Object Recognition Models without Human Labeling
- Title(参考訳): PennSyn2Real:人間ラベルなしの物体認識モデル
- Authors: Ty Nguyen, Ian D. Miller, Avi Cohen, Dinesh Thakur, Shashank Prasad,
Camillo J. Taylor, Pratik Chaudrahi, Vijay Kumar
- Abstract要約: 我々はPennSyn2Realを提案する。20種類以上のマイクロエアロビー(MAV)の10万以上の4K画像からなる合成データセットである。
このデータセットは、MAV検出や分類などのハイレベルコンピュータビジョンタスクのための任意の数のトレーニングイメージを生成するために使用することができる。
このフレームワークを用いて生成された合成データは,検出やセグメンテーションといった一般的なオブジェクト認識タスクに対して,CNNモデルをトレーニングするために直接利用できることを示す。
- 参考スコア(独自算出の注目度): 12.923677573437699
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scalable training data generation is a critical problem in deep learning. We
propose PennSyn2Real - a photo-realistic synthetic dataset consisting of more
than 100,000 4K images of more than 20 types of micro aerial vehicles (MAVs).
The dataset can be used to generate arbitrary numbers of training images for
high-level computer vision tasks such as MAV detection and classification. Our
data generation framework bootstraps chroma-keying, a mature cinematography
technique with a motion tracking system, providing artifact-free and curated
annotated images where object orientations and lighting are controlled. This
framework is easy to set up and can be applied to a broad range of objects,
reducing the gap between synthetic and real-world data. We show that synthetic
data generated using this framework can be directly used to train CNN models
for common object recognition tasks such as detection and segmentation. We
demonstrate competitive performance in comparison with training using only real
images. Furthermore, bootstrapping the generated synthetic data in few-shot
learning can significantly improve the overall performance, reducing the number
of required training data samples to achieve the desired accuracy.
- Abstract(参考訳): スケーラブルなトレーニングデータ生成は、ディープラーニングにおいて重要な問題である。
我々は20種以上の小型航空機(mav)の10万以上の4k画像からなる,フォトリアリスティックな合成データセットであるpennsyn2realを提案する。
このデータセットは、MAV検出や分類などのハイレベルコンピュータビジョンタスクのための任意の数のトレーニングイメージを生成するために使用できる。
我々のデータ生成フレームワークであるブートストラップクロマキーは、モーショントラッキングシステムを備えた成熟した撮影技術であり、オブジェクトの向きや照明が制御されるアーティファクトフリーでキュレーションされた注釈付き画像を提供する。
このフレームワークはセットアップが容易で、広範囲のオブジェクトに適用でき、合成データと実世界のデータのギャップを減らします。
このフレームワークを用いて生成された合成データは、検出やセグメンテーションなどの一般的なオブジェクト認識タスクに対してcnnモデルをトレーニングするために直接使用できることを示す。
実画像のみを用いたトレーニングと比較し,競争性能を示す。
さらに、生成した合成データを数ショットの学習でブートストラップすることで、全体的な性能が大幅に向上し、所望の精度を達成するために必要なトレーニングデータサンプルの数を減らすことができる。
関連論文リスト
- Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.696575161583618]
本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文 参考訳(メタデータ) (2024-10-30T07:11:41Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Image Captions are Natural Prompts for Text-to-Image Models [70.30915140413383]
本研究では,合成データの学習効果とプロンプトによる合成データ分布の関係を解析した。
本稿では,テキストから画像への生成モデルにより,より情報的で多様な学習データを合成する簡易かつ効果的な手法を提案する。
本手法は,合成学習データに基づいて訓練したモデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-07-17T14:38:11Z) - Synthetic Image Data for Deep Learning [0.294944680995069]
3次元モデルからレンダリングされたリアルな合成画像データを使用して、画像集合を拡大し、画像分類セグメンテーションモデルを訓練することができる。
実車の生産3次元CADモデルに基づく大規模合成データセットを,高品質な物理ベースレンダリングとドメインランダム化により効率的に作成できることを示す。
論文 参考訳(メタデータ) (2022-12-12T20:28:13Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - BIM Hyperreality: Data Synthesis Using BIM and Hyperrealistic Rendering
for Deep Learning [3.4461633417989184]
写真に物体認識を構築するニューラルネットワークを訓練するためのハイブリッドシステムの概念を提示する。
本論文で提示した具体的ケーススタディでは,合成データで学習したニューラルネットワークを用いて,トレーニングデータに写真を用いることなく,写真から物体を識別できることが示されている。
論文 参考訳(メタデータ) (2021-05-10T04:08:24Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z) - Can Synthetic Data Improve Object Detection Results for Remote Sensing
Images? [15.466412729455874]
本稿では,リモートセンシング画像航空機検出の性能向上のために,広域分布のリアルな合成データの利用を提案する。
レンダリング中に、インスタンスのサイズや背景画像のクラスなど、パラメータをランダムに設定します。
合成画像をよりリアルにするために,CycleGANと実際の未ラベル画像を用いて,画素レベルで合成画像を洗練する。
論文 参考訳(メタデータ) (2020-06-09T02:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。