論文の概要: A Robust Attentional Framework for License Plate Recognition in the Wild
- arxiv url: http://arxiv.org/abs/2006.03919v2
- Date: Tue, 9 Jun 2020 03:06:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:51:28.737922
- Title: A Robust Attentional Framework for License Plate Recognition in the Wild
- Title(参考訳): 野生におけるライセンスプレート認識のためのロバスト注意フレームワーク
- Authors: Linjiang Zhang, Peng Wang, Hui Li, Zhen Li, Chunhua Shen, Yanning
Zhang
- Abstract要約: 本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
- 参考スコア(独自算出の注目度): 95.7296788722492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing car license plates in natural scene images is an important yet
still challenging task in realistic applications. Many existing approaches
perform well for license plates collected under constrained conditions, eg,
shooting in frontal and horizontal view-angles and under good lighting
conditions. However, their performance drops significantly in an unconstrained
environment that features rotation, distortion, occlusion, blurring, shading or
extreme dark or bright conditions. In this work, we propose a robust framework
for license plate recognition in the wild. It is composed of a tailored
CycleGAN model for license plate image generation and an elaborate designed
image-to-sequence network for plate recognition. On one hand, the CycleGAN
based plate generation engine alleviates the exhausting human annotation work.
Massive amount of training data can be obtained with a more balanced character
distribution and various shooting conditions, which helps to boost the
recognition accuracy to a large extent. On the other hand, the 2D attentional
based license plate recognizer with an Xception-based CNN encoder is capable of
recognizing license plates with different patterns under various scenarios
accurately and robustly. Without using any heuristics rule or post-processing,
our method achieves the state-of-the-art performance on four public datasets,
which demonstrates the generality and robustness of our framework. Moreover, we
released a new license plate dataset, named "CLPD", with 1200 images from all
31 provinces in mainland China. The dataset can be available from:
https://github.com/wangpengnorman/CLPD_dataset.
- Abstract(参考訳): 自然の風景画像で車のナンバープレートを認識することは、現実的な応用において重要な課題である。
既存の多くのアプローチは、制約された条件下で収集されたナンバープレート、例えば正面と水平の視角での射撃、照明条件の良さでうまく機能する。
しかし、その性能は、回転、歪み、閉塞、ぼやけ、陰影または極暗または明るい条件を特徴とする制約のない環境で著しく低下する。
本研究では,野生におけるナンバープレート認識のためのロバストなフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
一方、CycleGANベースのプレート生成エンジンは、枯渇する人間のアノテーション作業を軽減する。
トレーニングデータの膨大な量は、よりバランスの取れた文字分布と様々な撮影条件によって得ることができ、認識精度を大幅に向上させるのに役立つ。
一方、XceptionベースのCNNエンコーダを備えた2Dアテンショナルプレート認識器は、様々なシナリオ下で異なるパターンのライセンスプレートを正確にかつ堅牢に認識することができる。
提案手法では, ヒューリスティックスルールや後処理を使わずに, 4つの公開データセット上での最先端性能を実現し, フレームワークの汎用性と堅牢性を示す。
さらに、中国本土31州から1200枚の画像が得られた新しいライセンスプレートデータセット「CLPD」を公開しました。
データセットは、https://github.com/wangpengnorman/CLPD_datasetから利用できる。
関連論文リスト
- A Training-Free Framework for Video License Plate Tracking and Recognition with Only One-Shot [25.032455444204466]
OneShotLPは、ビデオベースのライセンスプレートの検出と認識のためのトレーニング不要のフレームワークである。
広範なトレーニングデータなしで効果的に機能する機能と、さまざまなライセンスプレートスタイルへの適応性を提供する。
これは、インテリジェントトランスポートシステムにおける多様な現実世界のアプリケーションに事前訓練されたモデルを活用する可能性を強調している。
論文 参考訳(メタデータ) (2024-08-11T08:42:02Z) - A Dataset and Model for Realistic License Plate Deblurring [17.52035404373648]
ライセンスプレートブラ(LPBlur)と呼ばれる,最初の大規模ナンバープレートデブロアリングデータセットについて紹介する。
そこで我々は,ライセンスプレート・デブロアリングに対処するために,LPDGAN (L License Plate Deblurring Generative Adversarial Network) を提案する。
提案手法は,現実的なナンバープレートのデブロアリングシナリオにおいて,他の最先端の動作デブロアリング手法よりも優れる。
論文 参考訳(メタデータ) (2024-04-21T14:36:57Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - Iranian License Plate Recognition Using a Reliable Deep Learning
Approach [0.0]
本稿では,ライセンスプレートの認識を2段階に分けて行う。
最初のステップは、入力画像からライセンスプレートの矩形を検出することである。
第2ステップでは、これらのナンバープレートを画像から抽出し、その文字を認識する。
論文 参考訳(メタデータ) (2023-05-03T17:34:10Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - YOLO and Mask R-CNN for Vehicle Number Plate Identification [0.0]
The proposed Mask R-CNN method has achieved significant progress in character recognition。
オープンデータプレート収集で提示される方法論は他の手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-26T19:41:59Z) - Benchmarking Algorithms for Automatic License Plate Recognition [0.0]
我々はLPR(Automatic License Plate Recognition)のためのLPRNetと呼ばれる軽量畳み込みニューラルネットワーク(CNN)の評価を行った。
LPRNetはエンドツーエンドのフレームワークで、両方のデータセットで堅牢なパフォーマンスを示している。
適切にトレーニングされた後、LPRNetは特定のリージョンとデータセットの文字を認識するために使用することができる。
論文 参考訳(メタデータ) (2022-03-27T13:21:29Z) - Panoramic Panoptic Segmentation: Towards Complete Surrounding
Understanding via Unsupervised Contrastive Learning [97.37544023666833]
我々は,パノラマパオプティックセグメンテーションを最も総合的なシーン理解として導入する。
完全な周囲の理解は、エージェントに最大限の情報を提供する。
標準ピンホール画像のモデルトレーニングを可能にし、学習した機能を異なるドメインに転送するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-01T09:37:27Z) - Data-driven Meta-set Based Fine-Grained Visual Classification [61.083706396575295]
本稿では, ノイズの多いWeb画像に対して, 微粒化認識のためのデータ駆動型メタセットベースアプローチを提案する。
具体的には、少量のクリーンなメタセットでガイドされ、メタラーニング方式で選択ネットを訓練し、分布内および分布外ノイズ画像の識別を行う。
論文 参考訳(メタデータ) (2020-08-06T03:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。