論文の概要: Comparison of Image Preprocessing Techniques for Vehicle License Plate Recognition Using OCR: Performance and Accuracy Evaluation
- arxiv url: http://arxiv.org/abs/2410.13622v1
- Date: Tue, 15 Oct 2024 21:00:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:19:30.358575
- Title: Comparison of Image Preprocessing Techniques for Vehicle License Plate Recognition Using OCR: Performance and Accuracy Evaluation
- Title(参考訳): OCRを用いた車両ナンバープレート認識のための画像前処理技術の比較:性能と精度評価
- Authors: Renato Augusto Tavares,
- Abstract要約: この研究は、OCRアプリケーションで広く使われているブラジルの車両ナンバープレートのデータセットを使用している。
この研究は、ベストプラクティスを詳細に分析し、現実世界のシナリオでOCRのパフォーマンスを最適化するための洞察を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The growing use of Artificial Intelligence solutions has led to an explosion in image capture and its application in machine learning models. However, the lack of standardization in image quality generates inconsistencies in the results of these models. To mitigate this problem, Optical Character Recognition (OCR) is often used as a preprocessing technique, but it still faces challenges in scenarios with inadequate lighting, low resolution, and perspective distortions. This work aims to explore and evaluate various preprocessing techniques, such as grayscale conversion, CLAHE in RGB, and Bilateral Filter, applied to vehicle license plate recognition. Each technique is analyzed individually and in combination, using metrics such as accuracy, precision, recall, F1-score, ROC curve, AUC, and ANOVA, to identify the most effective method. The study uses a dataset of Brazilian vehicle license plates, widely used in OCR applications. The research provides a detailed analysis of best preprocessing practices, offering insights to optimize OCR performance in real-world scenarios.
- Abstract(参考訳): 人工知能ソリューションの利用が増加し、画像キャプチャーが爆発的に増加し、機械学習モデルにその応用がもたらされた。
しかし、画像品質の標準化の欠如は、これらのモデルの結果に矛盾をもたらす。
この問題を軽減するために、光学文字認識(OCR)は前処理技術としてよく用いられるが、照明の不十分、解像度の低さ、視点歪みといったシナリオでは依然として課題に直面している。
本研究の目的は、車両ナンバープレート認識に適用されたグレースケール変換、RGBのCLAHE、バイラテラルフィルタなど、様々なプリプロセッシング手法を探索し、評価することである。
各手法は、精度、精度、リコール、F1スコア、ROC曲線、AUC、ANOVAなどの指標を用いて、個別に、かつ、組み合わせて分析され、最も効果的な方法が特定される。
この研究は、OCRアプリケーションで広く使われているブラジルの車両ナンバープレートのデータセットを使用している。
この研究は、最高の前処理プラクティスを詳細に分析し、現実世界のシナリオでOCRのパフォーマンスを最適化するための洞察を提供する。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - DLoRA-TrOCR: Mixed Text Mode Optical Character Recognition Based On Transformer [12.966765239586994]
マルチフォント、混合シーン、複雑なレイアウトは、従来のOCRモデルの認識精度に深刻な影響を及ぼす。
本稿では,事前学習したOCR変換器,すなわちDLoRA-TrOCRに基づくパラメータ効率の良い混合テキスト認識手法を提案する。
論文 参考訳(メタデータ) (2024-04-19T09:28:16Z) - Efficient Test-Time Adaptation for Super-Resolution with Second-Order
Degradation and Reconstruction [62.955327005837475]
画像超解像(SR)は,低分解能(LR)から高分解能(HR)へのマッピングを,一対のHR-LRトレーニング画像を用いて学習することを目的としている。
SRTTAと呼ばれるSRの効率的なテスト時間適応フレームワークを提案し、SRモデルを異なる/未知の劣化型でテストドメインに迅速に適応させることができる。
論文 参考訳(メタデータ) (2023-10-29T13:58:57Z) - Precise localization of corneal reflections in eye images using deep
learning trained on synthetic data [9.150553995510217]
眼球画像中の1つの角膜反射(CR)の中心を正確に位置決めする深層学習法を提案する。
我々は、シミュレーションデータのみを用いてトレーニングされた畳み込みニューラルネットワーク(CNN)を使用している。
提案手法はCR中心位置決めの高精度な手法を提供し,データ可用性問題に対する解決策を提供する。
論文 参考訳(メタデータ) (2023-04-12T07:49:21Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Learning-Based Framework for Camera Calibration with Distortion
Correction and High Precision Feature Detection [14.297068346634351]
本稿では,これらのボトルネックに対処する従来の手法と学習に基づくアプローチを組み合わせたハイブリッドカメラキャリブレーションフレームワークを提案する。
特に、このフレームワークは学習に基づくアプローチを利用して、効率的な歪み補正とロバストなチェス盤角座標符号化を行う。
広範に使われている2つのカメラキャリブレーションツールボックスと比較して、実データと合成データの両方の実験結果は、提案フレームワークのより良い堅牢性と高い精度を示す。
論文 参考訳(メタデータ) (2022-02-01T00:19:18Z) - Generalized Real-World Super-Resolution through Adversarial Robustness [107.02188934602802]
本稿では,実世界のSRに取り組むために,敵攻撃の一般化能力を活用したロバスト超解法を提案する。
我々の新しいフレームワークは、現実世界のSR手法の開発においてパラダイムシフトをもたらす。
単一のロバストモデルを使用することで、実世界のベンチマークで最先端の特殊な手法より優れています。
論文 参考訳(メタデータ) (2021-08-25T22:43:20Z) - Learning Conditional Knowledge Distillation for Degraded-Reference Image
Quality Assessment [157.1292674649519]
劣化参照IQA(DR-IQA)という実用的な解を提案する。
DR-IQAはIRモデルの入力、劣化したイメージを参照として利用する。
私たちの結果は、フル参照設定のパフォーマンスに近いものもあります。
論文 参考訳(メタデータ) (2021-08-18T02:35:08Z) - Unknown-box Approximation to Improve Optical Character Recognition
Performance [7.805544279853116]
特定のOCRエンジン用にカスタマイズされたプリプロセッサを作成するための新しいアプローチが提示される。
2つのデータセットと2つのOCRエンジンによる実験は、提示されたプリプロセッサがOCRの精度をベースラインから最大46%向上できることを示している。
論文 参考訳(メタデータ) (2021-05-17T16:09:15Z) - Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。
従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。
これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。
従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文 参考訳(メタデータ) (2019-12-30T16:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。