論文の概要: Unified Chinese License Plate Detection and Recognition with High
Efficiency
- arxiv url: http://arxiv.org/abs/2205.03582v1
- Date: Sat, 7 May 2022 07:35:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 15:55:21.366608
- Title: Unified Chinese License Plate Detection and Recognition with High
Efficiency
- Title(参考訳): 高効率に統一された中国版ナンバープレートの検出と認識
- Authors: Yanxiang Gong, Linjie Deng, Shuai Tao, Xinchen Lu, Peicheng Wu, Zhiwei
Xie, Zheng Ma, Mei Xie
- Abstract要約: ディープラーニング手法は、ライセンスプレート(LP)検出および認識タスクにおいて優れたパフォーマンスを達成した。
大規模で代表的なデータセットが不足しているため、中国のLPのための堅牢なモデルを構築することは依然として困難である。
我々は、多目的の中国LP画像を含む中国道路プレートデータセット(CRPD)という新しいデータセットを提案する。
- 参考スコア(独自算出の注目度): 3.0279719282256137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, deep learning-based methods have reached an excellent performance
on License Plate (LP) detection and recognition tasks. However, it is still
challenging to build a robust model for Chinese LPs since there are not enough
large and representative datasets. In this work, we propose a new dataset named
Chinese Road Plate Dataset (CRPD) that contains multi-objective Chinese LP
images as a supplement to the existing public benchmarks. The images are mainly
captured with electronic monitoring systems with detailed annotations. To our
knowledge, CRPD is the largest public multi-objective Chinese LP dataset with
annotations of vertices. With CRPD, a unified detection and recognition network
with high efficiency is presented as the baseline. The network is end-to-end
trainable with totally real-time inference efficiency (30 fps with 640p). The
experiments on several public benchmarks demonstrate that our method has
reached competitive performance. The code and dataset will be publicly
available at https://github.com/yxgong0/CRPD.
- Abstract(参考訳): 近年、深層学習に基づく手法は、ライセンスプレート(LP)検出および認識タスクにおいて優れた性能に達している。
しかし、大規模な代表的データセットが十分ではないため、中国LPの堅牢なモデルを構築することは依然として困難である。
本研究では,既存ベンチマークの補足として,多目的の中国LP画像を含む中国道路プレートデータセット (CRPD) という新しいデータセットを提案する。
画像は主に詳細な注釈付き電子監視システムで撮影される。
我々の知る限り、CRPDは頂点のアノテーションを付加した中国最大の多目的LPデータセットである。
CRPDでは、高効率の統一検出認識ネットワークがベースラインとして提示される。
ネットワークは完全にリアルタイムの推論効率(640pの30 fps)で、エンドツーエンドでトレーニングできる。
いくつかの公開ベンチマーク実験により,本手法が競争性能に到達したことを示す。
コードとデータセットはhttps://github.com/yxgong0/CRPDで公開されている。
関連論文リスト
- Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline [70.30473488226093]
PBD(パワーバッテリ検出)と呼ばれる新しいタスクに関する総合的研究を行う。
X線画像から高密度陰極と陽極板のエンドポイントをローカライズし、電池の品質を評価することを目的としている。
我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-05T06:18:38Z) - Leveraging Multi-view Data for Improved Detection Performance: An
Industrial Use Case [0.5249805590164901]
高速かつ正確なソリューションを提供する多視点オブジェクト検出フレームワークを提案する。
本稿では,半自動地下構造データを用いた新しいマルチビューデータセットを提案する。
実験では, 0.5mmから27.0mmの成分を検出するため, mAPの15%の改善が示された。
論文 参考訳(メタデータ) (2023-04-17T09:41:37Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - Wukong: 100 Million Large-scale Chinese Cross-modal Pre-training Dataset
and A Foundation Framework [99.38817546900405]
本稿では,異なるマルチモーダル事前学習手法のベンチマークを行うため,中国の大規模クロスモーダルデータセットを提案する。
Wukongという大規模な中国のクロスモーダルデータセットをリリースし、Webから1億の中国語画像テキストペアを格納しています。
論文 参考訳(メタデータ) (2022-02-14T14:37:15Z) - On the Cross-dataset Generalization in License Plate Recognition [1.8514314381314887]
12のOCRモデルのクロスデータセット一般化を実証的に評価するために,従来の分割対1データセットアウトの実験的なセットアップを提案する。
その結果、ALPRコンテキストにおけるアプローチを評価するために、従来の分割プロトコルの制限に光を当てた。
論文 参考訳(メタデータ) (2022-01-02T00:56:09Z) - End-to-End License Plate Recognition Pipeline for Real-time Low Resource
Video Based Applications [0.43012765978447565]
リアルタイムの推論速度を実現するために、Vision APIと組み合わせた新しい2段階検出パイプラインを提案する。
私たちは、画像データセットと、野生のライセンスプレートを含むビデオデータセットに基づいて、モデルをトレーニングしました。
実時間処理速度(毎秒27.2フレーム)で妥当な検出・認識性能を観測した。
論文 参考訳(メタデータ) (2021-08-18T18:31:01Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。