論文の概要: Synthesizing Annotated Image and Video Data Using a Rendering-Based
Pipeline for Improved License Plate Recognition
- arxiv url: http://arxiv.org/abs/2209.14448v1
- Date: Wed, 28 Sep 2022 22:11:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:56:51.548594
- Title: Synthesizing Annotated Image and Video Data Using a Rendering-Based
Pipeline for Improved License Plate Recognition
- Title(参考訳): ライセンスプレート認識のためのレンダリングベースパイプラインによるアノテーション付き画像と映像データの合成
- Authors: Andreas Spruck, Maximilane Gruber, Anatol Maier, Denise Moussa,
J\"urgen Seiler, Christian Riess, Andr\'e Kaup
- Abstract要約: ニューラルネットワークアプリケーションでは、トレーニングサンプルの不足が一般的な問題である。
アノテーション付きデータセットを合成するための新しいレンダリングベースのパイプラインを提案する。
パイプラインは、完全に自動化された手順で、合成および部分リアルな画像および映像データを生成および注釈付けすることができる。
- 参考スコア(独自算出の注目度): 8.15545354580221
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An insufficient number of training samples is a common problem in neural
network applications. While data augmentation methods require at least a
minimum number of samples, we propose a novel, rendering-based pipeline for
synthesizing annotated data sets. Our method does not modify existing samples
but synthesizes entirely new samples. The proposed rendering-based pipeline is
capable of generating and annotating synthetic and partly-real image and video
data in a fully automatic procedure. Moreover, the pipeline can aid the
acquisition of real data. The proposed pipeline is based on a rendering
process. This process generates synthetic data. Partly-real data bring the
synthetic sequences closer to reality by incorporating real cameras during the
acquisition process. The benefits of the proposed data generation pipeline,
especially for machine learning scenarios with limited available training data,
are demonstrated by an extensive experimental validation in the context of
automatic license plate recognition. The experiments demonstrate a significant
reduction of the character error rate and miss rate from 73.74% and 100% to
14.11% and 41.27% respectively, compared to an OCR algorithm trained on a real
data set solely. These improvements are achieved by training the algorithm on
synthesized data solely. When additionally incorporating real data, the error
rates can be decreased further. Thereby, the character error rate and miss rate
can be reduced to 11.90% and 39.88% respectively. All data used during the
experiments as well as the proposed rendering-based pipeline for the automated
data generation is made publicly available under (URL will be revealed upon
publication).
- Abstract(参考訳): ニューラルネットワークアプリケーションでは、トレーニングサンプルの不足が一般的な問題である。
データ拡張法は少なくともサンプル数を必要とするが、アノテーション付きデータセットを合成するための新しいレンダリングベースのパイプラインを提案する。
本手法は既存のサンプルを修正せず,全く新しいサンプルを合成する。
提案するレンダリングベースパイプラインは、合成および部分実画像および映像データを完全に自動で生成・注釈することができる。
さらに、パイプラインは実際のデータの取得を支援することができる。
提案されたパイプラインはレンダリングプロセスに基づいている。
このプロセスは合成データを生成する。
一部実際のデータは、取得プロセス中に実際のカメラを組み込むことで、合成シーケンスを現実に近づける。
提案したデータ生成パイプラインの利点は、特に利用可能なトレーニングデータに制限のある機械学習シナリオにおいて、自動ナンバープレート認識の文脈における広範な実験的検証によって実証される。
実験では、実際のデータセットでのみ訓練されたOCRアルゴリズムと比較して、文字誤り率とミス率を73.74%と100%から14.11%と41.27%に大幅に削減した。
これらの改善は、合成データのみにアルゴリズムを訓練することで達成される。
さらに実データを組み込むと、エラー率をさらに低下させることができる。
これにより、文字誤り率とミスレートをそれぞれ11.90%と39.88%に減らすことができる。
実験で使用されるすべてのデータと、自動データ生成のためのレンダリングベースのパイプラインは、公開されている(URLが公開される)。
関連論文リスト
- A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - Towards Real-World Video Deblurring by Exploring Blur Formation Process [53.91239555063343]
近年、深層学習に基づくアプローチは、ビデオデブロアリングタスクにおいて有望な成功を収めている。
既存の合成データセットで訓練されたモデルは、現実世界のぼやけたシナリオよりも一般化の問題に悩まされている。
本稿では, RAW-Blur と呼ばれる, ぼかし生成の手がかりを生かして, 現実的なぼかし合成パイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-28T09:24:52Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Synt++: Utilizing Imperfect Synthetic Data to Improve Speech Recognition [18.924716098922683]
合成データによる機械学習は、合成データと実際のデータ分布のギャップのため、簡単ではない。
本稿では,分散ギャップに起因する問題を緩和するために,トレーニング中の2つの新しい手法を提案する。
これらの手法は,合成データを用いた音声認識モデルの訓練を著しく改善することを示す。
論文 参考訳(メタデータ) (2021-10-21T21:11:42Z) - Synthetic Data for Model Selection [2.4499092754102874]
合成データはモデル選択に有用であることを示す。
そこで本研究では,実領域に適合する合成誤差推定をキャリブレーションする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T09:52:03Z) - UnrealPerson: An Adaptive Pipeline towards Costless Person
Re-identification [102.58619642363959]
本稿では,unrealpersonという,非現実的な画像データをフル活用して,トレーニングとデプロイメントの両面でコストを削減する新しいパイプラインを提案する。
3,000のIDと12万のインスタンスで、MSMT17に直接転送されると38.5%のランク-1の精度が得られる。
論文 参考訳(メタデータ) (2020-12-08T08:15:30Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z) - Can Synthetic Data Improve Object Detection Results for Remote Sensing
Images? [15.466412729455874]
本稿では,リモートセンシング画像航空機検出の性能向上のために,広域分布のリアルな合成データの利用を提案する。
レンダリング中に、インスタンスのサイズや背景画像のクラスなど、パラメータをランダムに設定します。
合成画像をよりリアルにするために,CycleGANと実際の未ラベル画像を用いて,画素レベルで合成画像を洗練する。
論文 参考訳(メタデータ) (2020-06-09T02:23:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。