論文の概要: TransLPRNet: Lite Vision-Language Network for Single/Dual-line Chinese License Plate Recognition
- arxiv url: http://arxiv.org/abs/2507.17335v1
- Date: Wed, 23 Jul 2025 09:03:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-24 22:33:14.932654
- Title: TransLPRNet: Lite Vision-Language Network for Single/Dual-line Chinese License Plate Recognition
- Title(参考訳): TransLPRNet: シングルライン中国語ライセンスプレート認識のためのLite Vision-Language Network
- Authors: Guangzhu Xu, Zhi Ke, Pengcheng Zuo, Bangjun Lei,
- Abstract要約: 本稿では,軽量なビジュアルエンコーダとテキストデコーダを統合した統一型ソリューションを提案する。
複線ナンバープレートデータセットの不足を軽減するため,単線ナンバープレートデータセットを構築した。
提案アルゴリズムは、粗い局所化障害下での修正CCPDテストにおいて、平均認識精度99.34%を達成する。
- 参考スコア(独自算出の注目度): 1.1499574149885023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: License plate recognition in open environments is widely applicable across various domains; however, the diversity of license plate types and imaging conditions presents significant challenges. To address the limitations encountered by CNN and CRNN-based approaches in license plate recognition, this paper proposes a unified solution that integrates a lightweight visual encoder with a text decoder, within a pre-training framework tailored for single and double-line Chinese license plates. To mitigate the scarcity of double-line license plate datasets, we constructed a single/double-line license plate dataset by synthesizing images, applying texture mapping onto real scenes, and blending them with authentic license plate images. Furthermore, to enhance the system's recognition accuracy, we introduce a perspective correction network (PTN) that employs license plate corner coordinate regression as an implicit variable, supervised by license plate view classification information. This network offers improved stability, interpretability, and low annotation costs. The proposed algorithm achieves an average recognition accuracy of 99.34% on the corrected CCPD test set under coarse localization disturbance. When evaluated under fine localization disturbance, the accuracy further improves to 99.58%. On the double-line license plate test set, it achieves an average recognition accuracy of 98.70%, with processing speeds reaching up to 167 frames per second, indicating strong practical applicability.
- Abstract(参考訳): オープンな環境におけるナンバープレートの認識は、様々な領域で広く適用されているが、ナンバープレートの種類や撮像条件の多様性は大きな課題である。
ライセンスプレート認識におけるCNNおよびCRNNベースのアプローチの問題点に対処するため,本研究では,ライトウェイトなビジュアルエンコーダとテキストデコーダを統合した統合ソリューションを提案する。
複線ナンバープレートデータセットの不足を軽減するため,イメージを合成し,テクスチャマッピングを実際のシーンに適用し,それらを真のナンバープレート画像とブレンドすることで,シングル/ダブルラインナンバープレートデータセットを構築した。
さらに,システムの認識精度を高めるために,ライセンスプレート角座標の回帰を暗黙変数として用い,ライセンスプレートの視線分類情報によって教師される視点補正ネットワーク(PTN)を導入する。
このネットワークは、安定性、解釈可能性、アノテーションのコストを向上する。
提案アルゴリズムは、粗い局所化障害下での修正CCPDテストにおいて、平均認識精度99.34%を達成する。
微粒なローカライゼーション障害で評価すると、さらに99.58%に精度が向上する。
ダブルラインのナンバープレートテストセットでは、平均認識精度は98.70%に達し、処理速度は毎秒167フレームに達する。
関連論文リスト
- LPTR-AFLNet: Lightweight Integrated Chinese License Plate Rectification and Recognition Network [1.1499574149885023]
LPTR-AFLNetという,中国のナンバープレートの修正・認識のための軽量統一ネットワークを提案する。
パースペクティブ変換補正モジュール(PTR)と最適化されたナンバープレート認識ネットワークであるAFLNetを組み合わせている。
LPTR-AFLNetによる2線プレート画像の視線歪みの補正と認識における異常な性能を示す。
論文 参考訳(メタデータ) (2025-07-22T08:54:32Z) - Text to Image for Multi-Label Image Recognition with Joint Prompt-Adapter Learning [69.33115351856785]
本稿では,PEFTのテキストキャプションのみを使用する場合のモダリティギャップ問題に対処するため,T2I-PALと呼ばれる新しい手法を提案する。
T2I-PALの中核となる設計は、事前訓練されたテキスト-画像生成モデルを利用して、テキストキャプションからフォトリアリスティックで多様な画像を生成することである。
MS-COCO、VOC2007、NAS-WIDEを含む複数のベンチマークに対する大規模な実験は、我々のT2I-PALが認識性能を平均3.47%向上させることができることを示している。
論文 参考訳(メタデータ) (2025-06-12T11:09:49Z) - Learning for Transductive Threshold Calibration in Open-World Recognition [83.35320675679122]
グラフニューラルネットワークを用いた高剛性と適応性を有するトランスダクティブしきい値キャリブレーション法であるOpenGCNを導入する。
オープンワールドの視覚認識ベンチマークにおける実験は、オープンワールドのしきい値校正のための既存のポストホック校正方法よりもOpenGCNの方が優れていることを検証する。
論文 参考訳(メタデータ) (2023-05-19T23:52:48Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - Benchmarking Algorithms for Automatic License Plate Recognition [0.0]
我々はLPR(Automatic License Plate Recognition)のためのLPRNetと呼ばれる軽量畳み込みニューラルネットワーク(CNN)の評価を行った。
LPRNetはエンドツーエンドのフレームワークで、両方のデータセットで堅牢なパフォーマンスを示している。
適切にトレーニングされた後、LPRNetは特定のリージョンとデータセットの文字を認識するために使用することができる。
論文 参考訳(メタデータ) (2022-03-27T13:21:29Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - DSNet: A Dual-Stream Framework for Weakly-Supervised Gigapixel Pathology
Image Analysis [78.78181964748144]
スライド画像全体(WSI)を分類するための弱教師付きフレームワークを提案する。
WSIは通常、パッチレベルのラベルを持つパッチワイド分類によって処理される。
イメージレベルのラベルのみの場合、パッチの外観とイメージレベルのラベルの矛盾のため、パッチの分類はサブ最適となる。
論文 参考訳(メタデータ) (2021-09-13T09:10:43Z) - End-to-End License Plate Recognition Pipeline for Real-time Low Resource
Video Based Applications [0.43012765978447565]
リアルタイムの推論速度を実現するために、Vision APIと組み合わせた新しい2段階検出パイプラインを提案する。
私たちは、画像データセットと、野生のライセンスプレートを含むビデオデータセットに基づいて、モデルをトレーニングしました。
実時間処理速度(毎秒27.2フレーム)で妥当な検出・認識性能を観測した。
論文 参考訳(メタデータ) (2021-08-18T18:31:01Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Automatic Counting and Identification of Train Wagons Based on Computer
Vision and Deep Learning [70.84106972725917]
提案手法は費用対効果が高く,RFIDに基づく解を容易に置き換えることができる。
このシステムは、識別コードに損傷があるため、列車のワゴンの一部を自動的に拒絶することができる。
論文 参考訳(メタデータ) (2020-10-30T14:56:54Z) - A Robust Attentional Framework for License Plate Recognition in the Wild [95.7296788722492]
本稿では,ライセンスプレート認識のための堅牢なフレームワークを提案する。
ナンバープレート画像生成のためのCycleGANモデルと、プレート認識のための精巧な設計された画像系列ネットワークで構成されている。
われわれは、中国本土31州から1200枚の画像を含む新しいライセンスプレートデータセット「CLPD」をリリースした。
論文 参考訳(メタデータ) (2020-06-06T17:11:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。