論文の概要: Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach
- arxiv url: http://arxiv.org/abs/2011.14936v1
- Date: Mon, 30 Nov 2020 16:03:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:43:10.272816
- Title: Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach
- Title(参考訳): 高性能自動ナンバープレート認識手法の再検討と設計
- Authors: Yi Wang, Zhen-Peng Bian, Yunhao Zhou, Lap-Pui Chau
- Abstract要約: そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 16.66787965777127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a real-time and accurate automatic license plate
recognition (ALPR) approach. Our study illustrates the outstanding design of
ALPR with four insights: (1) the resampling-based cascaded framework is
beneficial to both speed and accuracy; (2) the highly efficient license plate
recognition should abundant additional character segmentation and recurrent
neural network (RNN), but adopt a plain convolutional neural network (CNN); (3)
in the case of CNN, taking advantage of vertex information on license plates
improves the recognition performance; and (4) the weight-sharing character
classifier addresses the lack of training images in small-scale datasets. Based
on these insights, we propose a novel ALPR approach, termed VSNet.
Specifically, VSNet includes two CNNs, i.e., VertexNet for license plate
detection and SCR-Net for license plate recognition, which is integrated in a
resampling-based cascaded manner. In VertexNet, we propose an efficient
integration block to extract the spatial features of license plates. With
vertex supervisory information, we propose a vertex-estimation branch in
VertexNet such that license plates can be rectified as the input images of
SCR-Net. Moreover, vertex-based data augmentation is employed to diverse the
training samples. In SCR-Net, we propose a horizontal encoding technique for
left-to-right feature extraction and a weight-sharing classifier for character
recognition. Experimental results show that the proposed VSNet outperforms
state-of-the-art methods by more than 50% relative improvement on error rate,
achieving >99% recognition accuracy on both CCPD and AOLP datasets with 149 FPS
inference speed.
- Abstract(参考訳): 本稿では,リアルタイムかつ高精度な自動ライセンスプレート認識(alpr)手法を提案する。
Our study illustrates the outstanding design of ALPR with four insights: (1) the resampling-based cascaded framework is beneficial to both speed and accuracy; (2) the highly efficient license plate recognition should abundant additional character segmentation and recurrent neural network (RNN), but adopt a plain convolutional neural network (CNN); (3) in the case of CNN, taking advantage of vertex information on license plates improves the recognition performance; and (4) the weight-sharing character classifier addresses the lack of training images in small-scale datasets.
これらの知見に基づき,VSNetと呼ばれる新しいALPR手法を提案する。
具体的には、VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
VertexNetでは,ライセンスプレートの空間的特徴を抽出する効率的な統合ブロックを提案する。
頂点監視情報を用いて,ライセンスプレートをSCR-Netの入力画像として修正できるように,VertexNetの頂点推定ブランチを提案する。
さらに、頂点に基づくデータ拡張により、トレーニングサンプルの多様性が向上する。
scr-netでは,左右特徴抽出のための水平符号化手法と文字認識のための重み付き分類器を提案する。
実験の結果,提案したVSNetは,誤差率を50%以上改善し,CCPDとAOLPの両方のデータセットの認識精度を149FPS推論速度で99%向上した。
関連論文リスト
- TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Semantic Communication Enabling Robust Edge Intelligence for
Time-Critical IoT Applications [87.05763097471487]
本稿では、時間クリティカルなIoTアプリケーションのためのセマンティック通信を用いて、堅牢なエッジインテリジェンスを設計することを目的とする。
本稿では,画像DCT係数が推定精度に与える影響を解析し,オフロードのためのチャネル非依存の有効性符号化を提案する。
論文 参考訳(メタデータ) (2022-11-24T20:13:17Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - Benchmarking Algorithms for Automatic License Plate Recognition [0.0]
我々はLPR(Automatic License Plate Recognition)のためのLPRNetと呼ばれる軽量畳み込みニューラルネットワーク(CNN)の評価を行った。
LPRNetはエンドツーエンドのフレームワークで、両方のデータセットで堅牢なパフォーマンスを示している。
適切にトレーニングされた後、LPRNetは特定のリージョンとデータセットの文字を認識するために使用することができる。
論文 参考訳(メタデータ) (2022-03-27T13:21:29Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - Ghost-dil-NetVLAD: A Lightweight Neural Network for Visual Place Recognition [3.6249801498927923]
本稿では,GhostCNNと呼ばれるフロントエンド認識モデルと学習可能なVLAD層をバックエンドとして構成した,軽量な教師付きエンドツーエンドニューラルネットワークを提案する。
提案する軽量モデルをさらに強化するため,Ghostモジュールに拡張畳み込みを加えて,より空間的意味情報を含む特徴を抽出し,精度を向上する。
論文 参考訳(メタデータ) (2021-12-22T06:05:02Z) - Implementing a foveal-pit inspired filter in a Spiking Convolutional
Neural Network: a preliminary study [0.0]
我々は,網膜卵管刺激によるガウスフィルタとランク順符号化の差異を取り入れたスポーキング畳み込みニューラルネットワーク(SCNN)を提示した。
このモデルは、Nengoライブラリーで実装されているように、スパイキングニューロンで動作するように適応されたバックプロパゲーションアルゴリズムの変種を用いて訓練される。
ネットワークは最大90%の精度で達成され、損失はクロスエントロピー関数を用いて計算される。
論文 参考訳(メタデータ) (2021-05-29T15:28:30Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Enabling certification of verification-agnostic networks via
memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。
L-inf の精度は 1% から 88% ,6% から 40% に改善した。
また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文 参考訳(メタデータ) (2020-10-22T12:32:29Z) - Towards End-to-end Car License Plate Location and Recognition in
Unconstrained Scenarios [0.0]
ライセンスプレートの検出と認識を同時に行うための効率的なフレームワークを提案する。
軽量で統一されたディープニューラルネットワークで、エンドツーエンドに最適化され、リアルタイムに動作する。
実験結果から,提案手法は従来の最先端手法よりも高速・高精度で優れていたことが示唆された。
論文 参考訳(メタデータ) (2020-08-25T09:51:33Z) - Identity-Aware Attribute Recognition via Real-Time Distributed Inference
in Mobile Edge Clouds [53.07042574352251]
我々は、MEC対応カメラ監視システムにおいて、re-IDを用いた歩行者属性認識のための新しいモデルの設計を行う。
本稿では,属性認識と人物再IDを協調的に考慮し,分散モジュールの集合を持つ新しい推論フレームワークを提案する。
そこで我々は,提案した分散推論フレームワークのモジュール分布の学習に基づくアルゴリズムを考案した。
論文 参考訳(メタデータ) (2020-08-12T12:03:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。