論文の概要: Towards End-to-end Car License Plate Location and Recognition in
Unconstrained Scenarios
- arxiv url: http://arxiv.org/abs/2008.10916v2
- Date: Mon, 11 Jul 2022 04:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 03:00:08.607143
- Title: Towards End-to-end Car License Plate Location and Recognition in
Unconstrained Scenarios
- Title(参考訳): 制約のないシナリオにおける車両ナンバープレートの位置と認識に向けて
- Authors: Shuxin Qin and Sijiang Liu
- Abstract要約: ライセンスプレートの検出と認識を同時に行うための効率的なフレームワークを提案する。
軽量で統一されたディープニューラルネットワークで、エンドツーエンドに最適化され、リアルタイムに動作する。
実験結果から,提案手法は従来の最先端手法よりも高速・高精度で優れていたことが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benefiting from the rapid development of convolutional neural networks, the
performance of car license plate detection and recognition has been largely
improved. Nonetheless, most existing methods solve detection and recognition
problems separately, and focus on specific scenarios, which hinders the
deployment for real-world applications. To overcome these challenges, we
present an efficient and accurate framework to solve the license plate
detection and recognition tasks simultaneously. It is a lightweight and unified
deep neural network, that can be optimized end-to-end and work in real-time.
Specifically, for unconstrained scenarios, an anchor-free method is adopted to
efficiently detect the bounding box and four corners of a license plate, which
are used to extract and rectify the target region features. Then, a novel
convolutional neural network branch is designed to further extract features of
characters without segmentation. Finally, the recognition task is treated as
sequence labeling problems, which are solved by Connectionist Temporal
Classification (CTC) directly. Several public datasets including images
collected from different scenarios under various conditions are chosen for
evaluation. Experimental results indicate that the proposed method
significantly outperforms the previous state-of-the-art methods in both speed
and precision.
- Abstract(参考訳): 畳み込みニューラルネットワークの急速な発展により、車のナンバープレートの検出と認識の性能が大きく改善された。
それにもかかわらず、既存のほとんどのメソッドは検出と認識の問題を別々に解決し、実際のアプリケーションのデプロイを妨げる特定のシナリオに焦点を当てている。
これらの課題を克服するために,ライセンスプレートの検出と認識を同時に行うための効率的かつ正確な枠組みを提案する。
軽量で統一されたディープニューラルネットワークで、エンドツーエンドに最適化され、リアルタイムに動作する。
具体的には、アンカーフリー方式を採用して、対象領域の特徴を抽出・修正するために使用するライセンスプレートのバウンディングボックスと4つのコーナーを効率的に検出する。
次に、セグメンテーションなしで文字の特徴をさらに抽出するために、新しい畳み込みニューラルネットワークブランチを設計する。
最後に、認識タスクをシーケンスラベリング問題として扱い、コネクタリスト時間分類(CTC)により直接解決する。
様々な条件下で異なるシナリオから収集された画像を含むいくつかの公開データセットが評価のために選択される。
実験の結果,提案手法は従来の最先端手法よりも速度と精度において有意に優れていた。
関連論文リスト
- Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - Learning-based Localizability Estimation for Robust LiDAR Localization [13.298113481670038]
LiDARベースのローカライゼーションとマッピングは、多くの現代のロボットシステムにおける中核的なコンポーネントの1つである。
本研究では,ロボット動作中の(非)局所性を検出するニューラルネットワークに基づく推定手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T01:12:00Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - QuickBrowser: A Unified Model to Detect and Read Simple Object in
Real-time [3.098115480186737]
本研究では,多桁認識を1段階物体検出モデルに組み込むことにより,この検出と読み取りの問題を軽量に解決することを目的とする。
アーキテクチャ、損失関数、データ拡張、トレーニングにおけるバックボーンと修正の選択は、このメソッドを堅牢で効率的かつ高速にします。
論文 参考訳(メタデータ) (2021-02-15T05:47:40Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z) - Anomaly Detection by One Class Latent Regularized Networks [36.67420338535258]
近年,GANに基づく半教師付きジェネレーティブ・アドバイザリアル・ネットワーク(GAN)手法が,異常検出タスクで人気を集めている。
遅延特徴空間でトレーニングデータの基盤となる構造を捕捉する新しい対角デュアルオートエンコーダネットワークを提案する。
実験の結果,MNISTおよびCIFAR10データセットおよびGTSRB停止信号データセットの最先端結果が得られた。
論文 参考訳(メタデータ) (2020-02-05T02:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。