論文の概要: License Plate Detection and Character Recognition Using Deep Learning and Font Evaluation
- arxiv url: http://arxiv.org/abs/2412.12572v1
- Date: Tue, 17 Dec 2024 06:03:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:02:09.971138
- Title: License Plate Detection and Character Recognition Using Deep Learning and Font Evaluation
- Title(参考訳): ディープラーニングとフォント評価を用いたライセンスプレート検出と文字認識
- Authors: Zahra Ebrahimi Vargoorani, Ching Yee Suen,
- Abstract要約: 本稿では,検出にFaster R-CNNとConnectionist Temporal Classification (CTC) ロスを用いたCNN-RNNモデルと,認識のためのMobileNet V3バックボーンを用いたデュアルディープラーニング戦略を提案する。
この研究は、ライセンスプレート(LP)認識におけるフォント機能の役割を調べ、ドライバ・ゴシック、ドレッドノート、カリフォルニア・クラレンドン、およびOpenALPRシステムで凝縮されたチューリッヒ・エクストラ・コンデンサーなどのフォントを分析した。
- 参考スコア(独自算出の注目度): 0.6215404942415159
- License:
- Abstract: License plate detection (LPD) is essential for traffic management, vehicle tracking, and law enforcement but faces challenges like variable lighting and diverse font types, impacting accuracy. Traditionally reliant on image processing and machine learning, the field is now shifting towards deep learning for its robust performance in various conditions. Current methods, however, often require tailoring to specific regional datasets. This paper proposes a dual deep learning strategy using a Faster R-CNN for detection and a CNN-RNN model with Connectionist Temporal Classification (CTC) loss and a MobileNet V3 backbone for recognition. This approach aims to improve model performance using datasets from Ontario, Quebec, California, and New York State, achieving a recall rate of 92% on the Centre for Pattern Recognition and Machine Intelligence (CENPARMI) dataset and 90% on the UFPR-ALPR dataset. It includes a detailed error analysis to identify the causes of false positives. Additionally, the research examines the role of font features in license plate (LP) recognition, analyzing fonts like Driver Gothic, Dreadnought, California Clarendon, and Zurich Extra Condensed with the OpenALPR system. It discovers significant performance discrepancies influenced by font characteristics, offering insights for future LPD system enhancements. Keywords: Deep Learning, License Plate, Font Evaluation
- Abstract(参考訳): ライセンスプレート検出(LPD)は、交通管理、車両追跡、法執行に不可欠であるが、可変照明や多様なフォントタイプといった課題に直面し、精度に影響を与えている。
従来は画像処理と機械学習に頼っていたこの分野は、さまざまな条件下での堅牢なパフォーマンスのために、ディープラーニングへとシフトしつつある。
しかし、現在の手法では、特定の地域データセットに合わせて調整する必要があることが多い。
本稿では,検出にFaster R-CNNとConnectionist Temporal Classification (CTC) ロスを用いたCNN-RNNモデルと,認識のためのMobileNet V3バックボーンを用いたデュアルディープラーニング戦略を提案する。
このアプローチは、オンタリオ州、ケベック州、カリフォルニア州、ニューヨーク州のデータセットを使用してモデルパフォーマンスを改善し、パターン認識とマシンインテリジェンス(CENPARMI)データセットで92%、UFPR-ALPRデータセットで90%のリコール率を達成することを目的としている。
これには、偽陽性の原因を特定するための詳細なエラー分析が含まれている。
さらに、ライセンスプレート(LP)認識におけるフォント機能の役割を調べ、ドライバ・ゴシック、ドレッドノート、カリフォルニア・クラレンドン、およびOpenALPRシステムで凝縮されたチューリッヒ・エクストラ・コンデンサーなどのフォントを分析した。
フォント特性に影響を受け、将来のLPDシステム拡張に対する洞察を提供する。
キーワード:ディープラーニング、ライセンスプレート、フォント評価
関連論文リスト
- Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark [2.326743352134195]
車両色認識(VCR)は、視覚的に区別可能な車両の属性であるため、重要な研究の関心を集めている。
このタスクの既存の手法の成功にもかかわらず、文献で使用されるデータセットの比較的低い複雑さは、ほとんど見過ごされてきている。
この研究は、より困難なVCRシナリオを表す新しいデータセットをコンパイルすることで、このギャップに対処する。
論文 参考訳(メタデータ) (2024-08-21T12:54:41Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - LoRA-like Calibration for Multimodal Deception Detection using ATSFace
Data [1.550120821358415]
本稿では,ビデオデータや誤認識のダイナミクスに固有の課題に対処する,注意を意識したニューラルネットワークを提案する。
我々は、精度を高めるマルチモーダル融合戦略を採用し、実生活の試行データセット上で92%の精度で精度を向上する。
論文 参考訳(メタデータ) (2023-09-04T06:22:25Z) - LVLane: Deep Learning for Lane Detection and Classification in
Challenging Conditions [2.5641096293146712]
本稿では,ディープラーニング手法に基づくエンドツーエンドの車線検出・分類システムを提案する。
本研究では,最新技術(SOTA)レーンローカライゼーションモデルにおいて重要な課題を提起するシナリオを包含する,厳密にキュレートされたユニークなデータセットを提案する。
そこで本研究では,CNNをベースとした検知器とシームレスに統合し,異なるレーンの識別を容易にする分類手法を提案する。
論文 参考訳(メタデータ) (2023-07-13T16:09:53Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Drifting Features: Detection and evaluation in the context of automatic
RRLs identification in VVV [0.0]
本稿では,データ特徴量で測定した特性の小さな変化に関連したドリフト特徴の概念について紹介し,考察する。
本手法は, 情報源の起源のタイルに関する有用な情報を含む特徴の減少セットを効率的に同定できることを示した。
論文 参考訳(メタデータ) (2021-05-04T19:07:32Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。