論文の概要: Efficient License Plate Recognition via Pseudo-Labeled Supervision with Grounding DINO and YOLOv8
- arxiv url: http://arxiv.org/abs/2510.25032v1
- Date: Tue, 28 Oct 2025 23:21:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.877465
- Title: Efficient License Plate Recognition via Pseudo-Labeled Supervision with Grounding DINO and YOLOv8
- Title(参考訳): DINOとYOLOv8を併用した擬似ラベルスーパービジョンによる高能率プレート認識
- Authors: Zahra Ebrahimi Vargoorani, Amir Mohammad Ghoreyshi, Ching Yee Suen,
- Abstract要約: ALPRは交通制御、駐車、車両追跡、料金徴収、法執行機関の応用において不可欠である。
本稿では, YOLOv8によるプレート検出・認識タスクの深層学習戦略を提案する。
これは、CENPARMI(Center for Pattern Recognition and Machine Intelligence)のデータセットで94%、UFPR-ALPRデータセットで91%という驚くべきリコール率を達成した。
- 参考スコア(独自算出の注目度): 0.29949629644252374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing a highly accurate automatic license plate recognition system (ALPR) is challenging due to environmental factors such as lighting, rain, and dust. Additional difficulties include high vehicle speeds, varying camera angles, and low-quality or low-resolution images. ALPR is vital in traffic control, parking, vehicle tracking, toll collection, and law enforcement applications. This paper proposes a deep learning strategy using YOLOv8 for license plate detection and recognition tasks. This method seeks to enhance the performance of the model using datasets from Ontario, Quebec, California, and New York State. It achieved an impressive recall rate of 94% on the dataset from the Center for Pattern Recognition and Machine Intelligence (CENPARMI) and 91% on the UFPR-ALPR dataset. In addition, our method follows a semi-supervised learning framework, combining a small set of manually labeled data with pseudo-labels generated by Grounding DINO to train our detection model. Grounding DINO, a powerful vision-language model, automatically annotates many images with bounding boxes for license plates, thereby minimizing the reliance on labor-intensive manual labeling. By integrating human-verified and model-generated annotations, we can scale our dataset efficiently while maintaining label quality, which significantly enhances the training process and overall model performance. Furthermore, it reports character error rates for both datasets, providing additional insight into system performance.
- Abstract(参考訳): 高度に正確な自動ナンバープレート認識システム (ALPR) の開発は, 照明, 雨, 塵などの環境要因により困難である。
その他の問題としては、高速度、様々なカメラアングル、低画質または低解像度の画像などがある。
ALPRは交通制御、駐車、車両追跡、料金徴収、法執行機関の応用において不可欠である。
本稿では, YOLOv8によるプレート検出・認識タスクの深層学習戦略を提案する。
この方法は、オンタリオ州、ケベック州、カリフォルニア州、ニューヨーク州のデータセットを使用して、モデルの性能を向上させることを目指している。
これは、CENPARMI(Center for Pattern Recognition and Machine Intelligence)のデータセットで94%、UFPR-ALPRデータセットで91%という驚くべきリコール率を達成した。
さらに,本手法は,手動でラベル付けしたデータの小さなセットと,DINOが生成した擬似ラベルを組み合わせて,検出モデルを訓練する半教師付き学習フレームワークに従う。
強力な視覚言語モデルであるGrounding DINOは、多くのイメージにライセンスプレートのバウンディングボックスを自動でアノテートすることで、労働集約的な手動ラベリングへの依存を最小限にする。
人間による検証とモデル生成のアノテーションを統合することで、ラベルの品質を維持しながらデータセットを効率的にスケールすることが可能となり、トレーニングプロセスと全体的なモデルパフォーマンスが大幅に向上する。
さらに、両方のデータセットの文字エラー率を報告し、システムパフォーマンスに関するさらなる洞察を提供する。
関連論文リスト
- A New Hybrid Model of Generative Adversarial Network and You Only Look Once Algorithm for Automatic License-Plate Recognition [1.6566053195631465]
本稿では,前処理ステップにおけるデブロリングのためのGAN(Generative Adversarial Network)を提案する。
YOLOv5は、ライセンスプレート検出(LPD)と文字認識(CR)の両方で0.026秒の検知時間を達成する。
提案モデルでは, LPD と CR をそれぞれ95%, 97% の精度で検出する。
論文 参考訳(メタデータ) (2025-09-08T16:34:54Z) - Connecting Vision and Emissions: A Behavioural AI Approach to Carbon Estimation in Road Design [0.0]
都市環境における二酸化炭素排出量を推定するためのリアルタイム車両検出・分類フレームワークを改良したYOLOv8を提案する。
このフレームワークは、検出された各車両が追跡され、そのバウンディングボックスが収穫され、ディープ光学文字認識(OCR)モジュールに渡されるハイブリッドパイプラインを含む。
このOCRシステムは、複数の畳み込みニューラルネットワーク(CNN)層で構成され、文字レベルの検出とライセンスプレートの復号のために特別に訓練されている。
論文 参考訳(メタデータ) (2025-06-18T11:50:24Z) - License Plate Detection and Character Recognition Using Deep Learning and Font Evaluation [0.6215404942415159]
本稿では,検出にFaster R-CNNとConnectionist Temporal Classification (CTC) ロスを用いたCNN-RNNモデルと,認識のためのMobileNet V3バックボーンを用いたデュアルディープラーニング戦略を提案する。
この研究は、ライセンスプレート(LP)認識におけるフォント機能の役割を調べ、ドライバ・ゴシック、ドレッドノート、カリフォルニア・クラレンドン、およびOpenALPRシステムで凝縮されたチューリッヒ・エクストラ・コンデンサーなどのフォントを分析した。
論文 参考訳(メタデータ) (2024-12-17T06:03:42Z) - TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - A High-Accuracy Unsupervised Person Re-identification Method Using
Auxiliary Information Mined from Datasets [53.047542904329866]
マルチモーダルな特徴学習のためのデータセットから抽出した補助情報を利用する。
本稿では,Restricted Label Smoothing Cross Entropy Loss (RLSCE), Weight Adaptive Triplet Loss (WATL), Dynamic Training Iterations (DTI)の3つの効果的なトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-05-06T10:16:18Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。