論文の概要: End-to-End License Plate Recognition Pipeline for Real-time Low Resource
Video Based Applications
- arxiv url: http://arxiv.org/abs/2108.08339v1
- Date: Wed, 18 Aug 2021 18:31:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-21 05:29:29.049629
- Title: End-to-End License Plate Recognition Pipeline for Real-time Low Resource
Video Based Applications
- Title(参考訳): リアルタイム低リソースビデオベースアプリケーションのためのエンド・ツー・エンドライセンスプレート認識パイプライン
- Authors: Alif Ashrafee, Akib Mohammed Khan, Mohammad Sabik Irbaz, MD Abdullah
Al Nasim
- Abstract要約: リアルタイムの推論速度を実現するために、Vision APIと組み合わせた新しい2段階検出パイプラインを提案する。
私たちは、画像データセットと、野生のライセンスプレートを含むビデオデータセットに基づいて、モデルをトレーニングしました。
実時間処理速度(毎秒27.2フレーム)で妥当な検出・認識性能を観測した。
- 参考スコア(独自算出の注目度): 0.43012765978447565
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Automatic License Plate Recognition systems aim to provide an end-to-end
solution towards detecting, localizing, and recognizing license plate
characters from vehicles appearing in video frames. However, deploying such
systems in the real world requires real-time performance in low-resource
environments. In our paper, we propose a novel two-stage detection pipeline
paired with Vision API that aims to provide real-time inference speed along
with consistently accurate detection and recognition performance. We used a
haar-cascade classifier as a filter on top of our backbone MobileNet SSDv2
detection model. This reduces inference time by only focusing on high
confidence detections and using them for recognition. We also impose a temporal
frame separation strategy to identify multiple vehicle license plates in the
same clip. Furthermore, there are no publicly available Bangla license plate
datasets, for which we created an image dataset and a video dataset containing
license plates in the wild. We trained our models on the image dataset and
achieved an AP(0.5) score of 86% and tested our pipeline on the video dataset
and observed reasonable detection and recognition performance (82.7% detection
rate, and 60.8% OCR F1 score) with real-time processing speed (27.2 frames per
second).
- Abstract(参考訳): 自動ナンバープレート認識システムは、ビデオフレームに現れる車両からナンバープレート文字を検出し、ローカライズし、認識するためのエンドツーエンドソリューションを提供することを目的としている。
しかし、そのようなシステムを現実世界にデプロイするには、低リソース環境でのリアルタイムパフォーマンスが必要である。
本稿では,Vision APIと組み合わせた新しい2段階検出パイプラインを提案する。
バックボーンのMobileNet SSDv2検出モデル上で,ハールカスケード分類器をフィルタとして使用した。
これにより、高信頼検出のみに着目して認識に使用することにより、推論時間を短縮する。
また,同じクリップ内の複数の車両ナンバープレートを識別するために,時間的フレーム分離戦略を課す。
さらに、banglaライセンスプレートデータセットは公開されておらず、画像データセットとライセンスプレートを含むビデオデータセットを野放しで作成しました。
画像データセットでモデルをトレーニングし、ap(0.5)スコアを86%で達成し、ビデオデータセットでパイプラインをテストし、リアルタイム処理速度(27.2フレーム/秒)で合理的な検出および認識性能(82.7%検出率、60.8%ocrf1スコア)を観測した。
関連論文リスト
- BVI-RLV: A Fully Registered Dataset and Benchmarks for Low-Light Video Enhancement [56.97766265018334]
本稿では,2つの異なる低照度条件下での様々な動きシナリオを持つ40のシーンからなる低照度映像データセットを提案する。
我々は、プログラム可能なモータードリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供し、異なる光レベルにわたるピクセルワイドフレームアライメントのための画像ベースアプローチによりそれを洗練する。
実験の結果,Low-light Video enhancement (LLVE) における完全登録ビデオペアの重要性が示された。
論文 参考訳(メタデータ) (2024-07-03T22:41:49Z) - A Dataset and Model for Realistic License Plate Deblurring [17.52035404373648]
ライセンスプレートブラ(LPBlur)と呼ばれる,最初の大規模ナンバープレートデブロアリングデータセットについて紹介する。
そこで我々は,ライセンスプレート・デブロアリングに対処するために,LPDGAN (L License Plate Deblurring Generative Adversarial Network) を提案する。
提案手法は,現実的なナンバープレートのデブロアリングシナリオにおいて,他の最先端の動作デブロアリング手法よりも優れる。
論文 参考訳(メタデータ) (2024-04-21T14:36:57Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - Benchmarking Algorithms for Automatic License Plate Recognition [0.0]
我々はLPR(Automatic License Plate Recognition)のためのLPRNetと呼ばれる軽量畳み込みニューラルネットワーク(CNN)の評価を行った。
LPRNetはエンドツーエンドのフレームワークで、両方のデータセットで堅牢なパフォーマンスを示している。
適切にトレーニングされた後、LPRNetは特定のリージョンとデータセットの文字を認識するために使用することができる。
論文 参考訳(メタデータ) (2022-03-27T13:21:29Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - 2nd Place Solution for Waymo Open Dataset Challenge - Real-time 2D
Object Detection [26.086623067939605]
本稿では,画像から2次元物体を検出するリアルタイム手法を提案する。
我々は、加速度RTを活用して、検出パイプラインの推論時間を最適化する。
我々のフレームワークはNvidia Tesla V100 GPU上で45.8ms/frameのレイテンシを実現する。
論文 参考訳(メタデータ) (2021-06-16T11:32:03Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Traffic Surveillance using Vehicle License Plate Detection and
Recognition in Bangladesh [0.0]
本稿では,バングラデシュの車両のナンバープレートを検出するために,畳み込みニューラルネットワーク(CNN)を訓練し,調整したYOLOv4オブジェクト検出モデルを提案する。
ここでは、ピソンパッケージであるTkinterをベースとしたグラフィカルユーザインタフェース(GUI)についても紹介する。
論文 参考訳(メタデータ) (2020-12-03T19:16:49Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。