論文の概要: LPTR-AFLNet: Lightweight Integrated Chinese License Plate Rectification and Recognition Network
- arxiv url: http://arxiv.org/abs/2507.16362v1
- Date: Tue, 22 Jul 2025 08:54:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.03638
- Title: LPTR-AFLNet: Lightweight Integrated Chinese License Plate Rectification and Recognition Network
- Title(参考訳): LPTR-AFLNet:ライトウェイト統合中国プレート認証・認識ネットワーク
- Authors: Guangzhu Xu, Pengcheng Zuo, Zhi Ke, Bangjun Lei,
- Abstract要約: LPTR-AFLNetという,中国のナンバープレートの修正・認識のための軽量統一ネットワークを提案する。
パースペクティブ変換補正モジュール(PTR)と最適化されたナンバープレート認識ネットワークであるAFLNetを組み合わせている。
LPTR-AFLNetによる2線プレート画像の視線歪みの補正と認識における異常な性能を示す。
- 参考スコア(独自算出の注目度): 1.1499574149885023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese License Plate Recognition (CLPR) faces numerous challenges in unconstrained and complex environments, particularly due to perspective distortions caused by various shooting angles and the correction of single-line and double-line license plates. Considering the limited computational resources of edge devices, developing a low-complexity, end-to-end integrated network for both correction and recognition is essential for achieving real-time and efficient deployment. In this work, we propose a lightweight, unified network named LPTR-AFLNet for correcting and recognizing Chinese license plates, which combines a perspective transformation correction module (PTR) with an optimized license plate recognition network, AFLNet. The network leverages the recognition output as a weak supervisory signal to effectively guide the correction process, ensuring accurate perspective distortion correction. To enhance recognition accuracy, we introduce several improvements to LPRNet, including an improved attention module to reduce confusion among similar characters and the use of Focal Loss to address class imbalance during training. Experimental results demonstrate the exceptional performance of LPTR-AFLNet in rectifying perspective distortion and recognizing double-line license plate images, maintaining high recognition accuracy across various challenging scenarios. Moreover, on lower-mid-range GPUs platform, the method runs in less than 10 milliseconds, indicating its practical efficiency and broad applicability.
- Abstract(参考訳): 中国ライセンスプレート認識(CLPR)は、様々な撮影角度による視点歪みや、単線および複線ナンバープレートの修正など、制約のない複雑な環境において多くの課題に直面している。
エッジデバイスの限られた計算資源を考えると、修正と認識の両方のための低複雑でエンドツーエンドの統合ネットワークを開発することは、リアルタイムで効率的なデプロイメントを実現するために不可欠である。
本研究では,中国ナンバープレートの修正と認識を行う軽量統一ネットワークLPTR-AFLNetを提案し,パースペクティブ変換補正モジュール(PTR)と最適化されたナンバープレート認識ネットワークAFLNetを組み合わせた。
ネットワークは、認識出力を弱い監督信号として利用して、補正プロセスを効果的にガイドし、正確な視点歪み補正を保証する。
認識精度を向上させるために,類似文字間の混同を低減するためにアテンションモジュールの改善や,トレーニング中のクラス不均衡に対応するためにFocal Lossを用いることなど,LPRNetのいくつかの改良点を紹介した。
LPTR-AFLNetは、視線歪みの補正と二重線プレート画像の認識において、様々な難易度シナリオにおいて高い認識精度を維持した。
さらに、低中距離GPUプラットフォームでは、10ミリ秒未満で動作し、その実用的効率と幅広い適用性を示している。
関連論文リスト
- Knowledge Regularized Negative Feature Tuning of Vision-Language Models for Out-of-Distribution Detection [54.433899174017185]
信頼性の高い機械学習モデルを構築するには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
我々はKR-NFT(Knowledge Regularized Negative Feature Tuning)と呼ばれる新しい手法を提案する。
NFTは、事前訓練されたテキスト特徴に分布認識変換を適用し、正および負の特徴を異なる空間に効果的に分離する。
ImageNetデータセットから数発のサンプルをトレーニングすると、KR-NFTはID分類精度とOOD検出を改善するだけでなく、FPR95を5.44%削減する。
論文 参考訳(メタデータ) (2025-07-26T07:44:04Z) - TransLPRNet: Lite Vision-Language Network for Single/Dual-line Chinese License Plate Recognition [1.1499574149885023]
本稿では,軽量なビジュアルエンコーダとテキストデコーダを統合した統一型ソリューションを提案する。
複線ナンバープレートデータセットの不足を軽減するため,単線ナンバープレートデータセットを構築した。
提案アルゴリズムは、粗い局所化障害下での修正CCPDテストにおいて、平均認識精度99.34%を達成する。
論文 参考訳(メタデータ) (2025-07-23T09:03:01Z) - LD-RPMNet: Near-Sensor Diagnosis for Railway Point Machines [9.85616523216096]
本研究では,トランスフォーマーと畳み込みニューラルネットワークを統合したLD-RPMNetという軽量モデルを提案する。
鉄道車両の運転中に収集した音信号に基づく実験結果から, 最適化されたモデルによりパラメータ数と計算複雑性を50%低減できることが示された。
このことは、鉄道車両における近接センサ故障診断の応用の可能性を示している。
論文 参考訳(メタデータ) (2025-06-01T17:30:19Z) - Breaking Complexity Barriers: High-Resolution Image Restoration with Rank Enhanced Linear Attention [54.42902794496325]
ソフトマックスアテンションの変種である線形アテンションは、グローバルコンテキストモデリングにおける約束を示す。
軽量な奥行き畳み込みを統合することで特徴表現を充実させる簡易かつ効果的な方法であるRランク拡張線形アテンション(RELA)を提案する。
本稿では,RELA をベースとした画像復元変換器 LAformer を提案する。
論文 参考訳(メタデータ) (2025-05-22T02:57:23Z) - Federated Learning of Low-Rank One-Shot Image Detection Models in Edge Devices with Scalable Accuracy and Compute Complexity [5.820612543019548]
LoRa-FLは、エッジデバイスにデプロイされた低ランクのワンショット画像検出モデルをトレーニングするために設計された。
低ランク適応手法をワンショット検出アーキテクチャに組み込むことで,計算と通信のオーバーヘッドを大幅に低減する。
論文 参考訳(メタデータ) (2025-04-23T08:40:44Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Overcoming Distribution Mismatch in Quantizing Image Super-Resolution Networks [53.23803932357899]
量子化は画像超解像(SR)ネットワークの精度を低下させる。
既存の作業は、テスト時間中に量子化範囲を動的に適応することで、この分散ミスマッチ問題に対処する。
本稿では,SRネットワークにおける分散ミスマッチ問題を効果的に克服する量子化対応学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-25T08:50:01Z) - Efficient Parallel Split Learning over Resource-constrained Wireless
Edge Networks [44.37047471448793]
本稿では,エッジコンピューティングパラダイムと並列分割学習(PSL)の統合を提唱する。
そこで本研究では,モデル学習を高速化するために,効率的な並列分割学習(EPSL)という革新的なPSLフレームワークを提案する。
提案するEPSLフレームワークは,目標精度を達成するために必要なトレーニング遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2023-03-26T16:09:48Z) - End-to-End High Accuracy License Plate Recognition Based on Depthwise
Separable Convolution Networks [0.0]
ライセンスプレート認識のための新しいセグメンテーションフリーフレームワークを提案し,NP-ALPRデータセットを導入した。
提案するネットワークモデルは,最新のディープラーニング手法と最先端のアイデアと,新しいネットワークアーキテクチャのメリットで構成されている。
提案手法の有効性を3つの異なるデータセットで評価し,99%以上,70fps以上の認識精度を示した。
論文 参考訳(メタデータ) (2022-02-21T14:45:03Z) - BLPnet: A new DNN model and Bengali OCR engine for Automatic License
Plate Recognition [1.924182131418037]
本稿では,ベンガル文字の自動ライセンスプレート認識(ALPR)システムについて報告する。
計算ニューラルネットワーク(CNN)ベースの新しいベンガルOCRエンジンにより、モデルは文字回転不変である。
リアルタイムビデオ映像に毎秒17フレーム(fps)を投入するモデルは、平均正方形誤差(MSE)0.0152の車両を検知でき、平均ナンバープレート文字認識精度は95%である。
論文 参考訳(メタデータ) (2022-02-18T22:58:53Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Rethinking and Designing a High-performing Automatic License Plate
Recognition Approach [16.66787965777127]
そこで我々は,VSNetと呼ばれる新しい自動ナンバープレート認識(ALPR)手法を提案する。
VSNetには2つのCNN、すなわちライセンスプレート検出用のVertexNetとライセンスプレート認識用のSCR-Netが含まれている。
実験結果から,提案したVSNetは,エラー率の相対的改善率が50%以上向上し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-11-30T16:03:57Z) - Enabling certification of verification-agnostic networks via
memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。
L-inf の精度は 1% から 88% ,6% から 40% に改善した。
また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文 参考訳(メタデータ) (2020-10-22T12:32:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。