論文の概要: MF-LPR$^2$: Multi-Frame License Plate Image Restoration and Recognition using Optical Flow
- arxiv url: http://arxiv.org/abs/2508.14797v1
- Date: Tue, 19 Aug 2025 07:18:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.509494
- Title: MF-LPR$^2$: Multi-Frame License Plate Image Restoration and Recognition using Optical Flow
- Title(参考訳): MF-LPR$^2$:光フローを用いた多フレームプレート画像復元と認識
- Authors: Kihyun Na, Junseok Oh, Youngkwan Cho, Bumjin Kim, Sungmin Cho, Jinyoung Choi, Injung Kim,
- Abstract要約: ダッシュカム画像のナンバープレート領域は、解像度が低く、動きがぼやけ、光沢に悩まされることが多い。
事前訓練を頼りにしている既存の生成モデルは、そのような品質の悪いイメージを確実に復元することはできない。
本稿では,MF-LPR$2のマルチフレームプレート復元認識フレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.978269258341259
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: License plate recognition (LPR) is important for traffic law enforcement, crime investigation, and surveillance. However, license plate areas in dash cam images often suffer from low resolution, motion blur, and glare, which make accurate recognition challenging. Existing generative models that rely on pretrained priors cannot reliably restore such poor-quality images, frequently introducing severe artifacts and distortions. To address this issue, we propose a novel multi-frame license plate restoration and recognition framework, MF-LPR$^2$, which addresses ambiguities in poor-quality images by aligning and aggregating neighboring frames instead of relying on pretrained knowledge. To achieve accurate frame alignment, we employ a state-of-the-art optical flow estimator in conjunction with carefully designed algorithms that detect and correct erroneous optical flow estimations by leveraging the spatio-temporal consistency inherent in license plate image sequences. Our approach enhances both image quality and recognition accuracy while preserving the evidential content of the input images. In addition, we constructed a novel Realistic LPR (RLPR) dataset to evaluate MF-LPR$^2$. The RLPR dataset contains 200 pairs of low-quality license plate image sequences and high-quality pseudo ground-truth images, reflecting the complexities of real-world scenarios. In experiments, MF-LPR$^2$ outperformed eight recent restoration models in terms of PSNR, SSIM, and LPIPS by significant margins. In recognition, MF-LPR$^2$ achieved an accuracy of 86.44%, outperforming both the best single-frame LPR (14.04%) and the multi-frame LPR (82.55%) among the eleven baseline models. The results of ablation studies confirm that our filtering and refinement algorithms significantly contribute to these improvements.
- Abstract(参考訳): 免許プレート認識(LPR)は、交通法執行、犯罪捜査、監視において重要である。
しかし、ダッシュカム画像のナンバープレート領域は、しばしば低解像度、動きのぼやけ、グラアに悩まされ、正確な認識が困難になる。
事前訓練を頼りにしている既存の生成モデルは、このような品質の悪いイメージを確実に復元することができず、深刻なアーティファクトや歪みを頻繁に導入する。
この問題に対処するため,MF-LPR$^2$という新しい多フレームプレート復元・認識フレームワークを提案する。
正確なフレームアライメントを実現するために,ライセンスプレート画像シーケンスに固有の時空間的一貫性を活用して,誤った光フロー推定を検出・補正する,最先端の光フロー推定器を慎重に設計したアルゴリズムと併用する。
提案手法は,入力画像の明細内容を保存しながら,画像品質と認識精度を両立させる。
さらに,MF-LPR$^2$を評価するために,RLPR(Realistic LPR)データセットを構築した。
RLPRデータセットには200対の低品質のナンバープレート画像シーケンスと、現実世界のシナリオの複雑さを反映した高品質の擬似地平線画像が含まれている。
実験では、MF-LPR$^2$はPSNR、SSIM、LPIPSの8つの最近の修復モデルより大幅に性能が向上した。
MF-LPR$^2$は86.44%の精度を達成し、11のベースラインモデルの中で最高のシングルフレームLPR(14.04%)とマルチフレームLPR(82.55%)の両方を上回った。
アブレーション研究の結果, フィルタリングおよび精錬アルゴリズムがこれらの改善に大きく寄与していることが確認された。
関連論文リスト
- LAFR: Efficient Diffusion-based Blind Face Restoration via Latent Codebook Alignment Adapter [52.93785843453579]
低品質(LQ)画像からのブラインド顔復元は、高忠実度画像再構成と顔認証の保存を必要とする課題である。
LAFRは,LQ画像の潜時分布とHQ画像の潜時分布を一致させる,新しいコードブックベースの潜時空間アダプタである。
FFHQデータセットのわずか0.9%での拡散の軽量な微調整は、最先端の手法に匹敵する結果を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2025-05-29T14:11:16Z) - Toward Advancing License Plate Super-Resolution in Real-World Scenarios: A Dataset and Benchmark [2.7961815663180425]
LPR(Super- resolution for License Plate Recognition)は、監視、交通監視、法医学的応用において、低解像度(LR)および劣化した画像によって引き起こされる課題に対処することを目的としている。
UFPR-SR-Platesは、10万のトラックと10万のペアの低解像度と高解像度のプレート画像を含む新しいデータセットである。
ライセンスプレートの超解像のための2つの最先端モデルと、車両毎の複数の逐次LRと高分解能(HR)画像を用いたベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-09T19:37:57Z) - LATINO-PRO: LAtent consisTency INverse sOlver with PRompt Optimization [5.962724199486207]
テキスト・ツー・イメージ潜時拡散モデル (LDM) は、画像の逆問題解決の可能性を持つ強力な生成モデルとして最近登場した。
逆ソルバ内に生成モデルを埋め込むための新しいフレームワークを提案し,特にLCM(Latent Consistency Models)に注目した。
LATINOは極めて正確な評価を行い、以前のアプローチよりもはるかにメモリと効率が良い。
論文 参考訳(メタデータ) (2025-03-16T19:11:44Z) - Enhancing License Plate Super-Resolution: A Layout-Aware and Character-Driven Approach [2.9628782269544685]
本稿では, LPRタスク自体の性能だけでなく, 解像度, テクスチャ, 構造的詳細などの要因を考慮した新しい損失関数Layout and Character Oriented Focal Loss(LCOFL)を提案する。
我々は、変形可能な畳み込みと共有重み付けを用いた文字特徴学習を強化し、識別器として光学文字認識(OCR)モデルを用いたGANベースのトレーニングアプローチを採用する。
実験の結果, 文字再構成の精度は向上し, 定量化と定性化の両面で, 最先端の2つの手法に優れていた。
論文 参考訳(メタデータ) (2024-08-27T14:40:19Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Combining Attention Module and Pixel Shuffle for License Plate
Super-Resolution [3.8831062015253055]
本研究は,低解像度・低画質画像におけるライセンスプレート(LP)再構成に焦点を当てた。
本稿では、注目/変圧器モジュールの概念を拡張したシングルイメージ超解法(SISR)アプローチを提案する。
実験では, 提案手法は, 定量的および定性的に, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-10-30T13:05:07Z) - MASA-SR: Matching Acceleration and Spatial Adaptation for
Reference-Based Image Super-Resolution [74.24676600271253]
本稿では、RefSRのためのMASAネットワークを提案し、これらの問題に対処するために2つの新しいモジュールを設計する。
提案したMatch & extract Moduleは、粗大な対応マッチング方式により計算コストを大幅に削減する。
空間適応モジュールは、LR画像とRef画像の分布の差を学習し、Ref特徴の分布を空間適応的にLR特徴の分布に再マップする。
論文 参考訳(メタデータ) (2021-06-04T07:15:32Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。