論文の概要: Toward Advancing License Plate Super-Resolution in Real-World Scenarios: A Dataset and Benchmark
- arxiv url: http://arxiv.org/abs/2505.06393v1
- Date: Fri, 09 May 2025 19:37:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.823757
- Title: Toward Advancing License Plate Super-Resolution in Real-World Scenarios: A Dataset and Benchmark
- Title(参考訳): 現実世界シナリオにおけるライセンスプレート超解法の改善に向けて:データセットとベンチマーク
- Authors: Valfride Nascimento, Gabriel E. Lima, Rafael O. Ribeiro, William Robson Schwartz, Rayson Laroca, David Menotti,
- Abstract要約: LPR(Super- resolution for License Plate Recognition)は、監視、交通監視、法医学的応用において、低解像度(LR)および劣化した画像によって引き起こされる課題に対処することを目的としている。
UFPR-SR-Platesは、10万のトラックと10万のペアの低解像度と高解像度のプレート画像を含む新しいデータセットである。
ライセンスプレートの超解像のための2つの最先端モデルと、車両毎の複数の逐次LRと高分解能(HR)画像を用いたベンチマークを構築した。
- 参考スコア(独自算出の注目度): 2.7961815663180425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in super-resolution for License Plate Recognition (LPR) have sought to address challenges posed by low-resolution (LR) and degraded images in surveillance, traffic monitoring, and forensic applications. However, existing studies have relied on private datasets and simplistic degradation models. To address this gap, we introduce UFPR-SR-Plates, a novel dataset containing 10,000 tracks with 100,000 paired low and high-resolution license plate images captured under real-world conditions. We establish a benchmark using multiple sequential LR and high-resolution (HR) images per vehicle -- five of each -- and two state-of-the-art models for super-resolution of license plates. We also investigate three fusion strategies to evaluate how combining predictions from a leading Optical Character Recognition (OCR) model for multiple super-resolved license plates enhances overall performance. Our findings demonstrate that super-resolution significantly boosts LPR performance, with further improvements observed when applying majority vote-based fusion techniques. Specifically, the Layout-Aware and Character-Driven Network (LCDNet) model combined with the Majority Vote by Character Position (MVCP) strategy led to the highest recognition rates, increasing from 1.7% with low-resolution images to 31.1% with super-resolution, and up to 44.7% when combining OCR outputs from five super-resolved images. These findings underscore the critical role of super-resolution and temporal information in enhancing LPR accuracy under real-world, adverse conditions. The proposed dataset is publicly available to support further research and can be accessed at: https://valfride.github.io/nascimento2024toward/
- Abstract(参考訳): 超高解像度プレート認識(LPR)の最近の進歩は、監視、交通監視、法医学的応用において、低解像度(LR)および劣化した画像によって引き起こされる課題に対処することを目指している。
しかし、既存の研究は、プライベートデータセットと単純化された劣化モデルに依存している。
UFPR-SR-Platesは、10万のトラックと10万のペアの低解像度と高解像度のプレート画像を含む新しいデータセットである。
ライセンスプレートの超高解像度化のための2つの最先端モデルと,車両毎の複数の逐次LRと高分解能(HR)画像を用いたベンチマークを構築した。
また,複数の超解像プレートに対する先行する光学文字認識(OCR)モデルからの予測を組み合わせることで,全体の性能が向上することを示す3つの融合戦略についても検討した。
以上の結果から,超高分解能はLPR性能を著しく向上させ,多数決による融合技術の適用においてさらなる改善が見られた。
特に、LCDNet(Layout-Aware and Character-Driven Network)モデルとMVCP(Majority Vote by Character Position)戦略が組み合わされ、低解像度画像では1.7%、超解像度画像では31.1%、超解像度画像では44.7%に増加した。
これらの知見は, 現実的, 悪条件下でのLPRの精度向上における超解像情報と時間情報の重要性を浮き彫りにした。
提案されたデータセットは、さらなる研究をサポートするために公開されており、https://valfride.github.io/nascimento2024toward/.comでアクセスすることができる。
関連論文リスト
- ControlSR: Taming Diffusion Models for Consistent Real-World Image Super Resolution [68.72454974431749]
我々は、一貫した実世界の画像超解像(Real-ISR)に対して拡散モデルをテーム化する新しい方法であるControlSRを提案する。
提案モデルでは,複数のテストセット上で複数の測定値にまたがる性能が向上し,既存の手法よりもLR画像でより一貫したSR結果が得られる。
論文 参考訳(メタデータ) (2024-10-18T08:35:57Z) - License Plate Super-Resolution Using Diffusion Models [1.3499500088995464]
本研究は,画像復元における他の深層学習技術より一貫して優れる最先端拡散モデルを活用する。
この方法は、SwinIRとESRGANをそれぞれ12.55%、Pak Signal-to-Noise Ratio(PSNR)を37.32%改善する。
論文 参考訳(メタデータ) (2023-09-21T22:06:23Z) - Super-Resolution of License Plate Images Using Attention Modules and
Sub-Pixel Convolution Layers [3.8831062015253055]
監視画像における構造的特徴およびテクスチャ的特徴の検出を強化するために,Single-Image Super-Resolution (SISR) アプローチを導入する。
提案手法は,サブピクセルの畳み込み層と,光学的文字認識(OCR)モデルを用いて特徴抽出を行うロス関数を含む。
以上の結果から, これらの低解像度合成画像の再構成手法は, 定量化と定性化の両面で, 既存の画像よりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-05-27T00:17:19Z) - Combining Attention Module and Pixel Shuffle for License Plate
Super-Resolution [3.8831062015253055]
本研究は,低解像度・低画質画像におけるライセンスプレート(LP)再構成に焦点を当てた。
本稿では、注目/変圧器モジュールの概念を拡張したシングルイメージ超解法(SISR)アプローチを提案する。
実験では, 提案手法は, 定量的および定性的に, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-10-30T13:05:07Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。
深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。
本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文 参考訳(メタデータ) (2022-06-06T13:28:15Z) - Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。
このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。
リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。
イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文 参考訳(メタデータ) (2021-03-29T02:58:27Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - FAN: Frequency Aggregation Network for Real Image Super-resolution [33.30542701042704]
単一画像超解像(SISR)は、低解像度(LR)入力画像から高解像度(HR)画像を復元することを目的としている。
実世界の超可溶化問題に対処するために,周波数集約ネットワークであるFANを提案する。
論文 参考訳(メタデータ) (2020-09-30T10:18:41Z) - Joint Generative Learning and Super-Resolution For Real-World
Camera-Screen Degradation [6.14297871633911]
現実世界の単一画像超解像(SISR)タスクでは、低解像度画像はより複雑な劣化に苦しむ。
本稿では,カメラ画面の劣化に着目し,実世界のデータセット(Cam-ScreenSR)を構築する。
まず、ダウンサンプリング劣化GAN(DD-GAN)をトレーニングし、その分解をモデル化し、より多様なLR画像を生成する。
そして、二重残差チャネルアテンションネットワーク(DuRCAN)がSR画像の復元を学習する。
論文 参考訳(メタデータ) (2020-08-01T07:10:13Z) - HighRes-net: Recursive Fusion for Multi-Frame Super-Resolution of
Satellite Imagery [55.253395881190436]
MFSR(Multi-frame Super-Resolution)は、問題に対するより根底的なアプローチを提供する。
これは、地球上の人間の影響を衛星で観測する上で重要である。
我々は,MFSRにおける最初のディープラーニングアプローチであるHighRes-netを紹介し,そのサブタスクをエンドツーエンドで学習する。
論文 参考訳(メタデータ) (2020-02-15T22:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。