論文の概要: VRAE: Vertical Residual Autoencoder for License Plate Denoising and Deblurring
- arxiv url: http://arxiv.org/abs/2509.08392v2
- Date: Thu, 11 Sep 2025 16:45:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 13:52:32.873909
- Title: VRAE: Vertical Residual Autoencoder for License Plate Denoising and Deblurring
- Title(参考訳): VRAE: ナンバープレートのデノイングとデブロアリングのための垂直残像自動エンコーダ
- Authors: Cuong Nguyen, Dung T. Tran, Hong Nguyen, Xuan-Vu Phan, Nam-Phong Nguyen,
- Abstract要約: 劣化した画像を高速にリアルタイムに復元することは、認識性能を高めるための重要な前処理ステップである。
本研究では,交通監視における画像強調作業のための垂直残差オートエンコーダアーキテクチャを提案する。
可視光プレートを用いた車両画像データセット実験により,本手法がAutoencoder(AE),Generative Adversarial Network(GAN),Flow-Based(FB)アプローチを一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 2.1639459844313564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world traffic surveillance, vehicle images captured under adverse weather, poor lighting, or high-speed motion often suffer from severe noise and blur. Such degradations significantly reduce the accuracy of license plate recognition systems, especially when the plate occupies only a small region within the full vehicle image. Restoring these degraded images a fast realtime manner is thus a crucial pre-processing step to enhance recognition performance. In this work, we propose a Vertical Residual Autoencoder (VRAE) architecture designed for the image enhancement task in traffic surveillance. The method incorporates an enhancement strategy that employs an auxiliary block, which injects input-aware features at each encoding stage to guide the representation learning process, enabling better general information preservation throughout the network compared to conventional autoencoders. Experiments on a vehicle image dataset with visible license plates demonstrate that our method consistently outperforms Autoencoder (AE), Generative Adversarial Network (GAN), and Flow-Based (FB) approaches. Compared with AE at the same depth, it improves PSNR by about 20%, reduces NMSE by around 50%, and enhances SSIM by 1%, while requiring only a marginal increase of roughly 1% in parameters.
- Abstract(参考訳): 現実世界の交通監視では、悪天候下で撮影された車両の画像、照明の弱さ、または高速な動きは、しばしば激しい騒音とぼやけに悩まされる。
このような劣化により、ナンバープレート認識システムの精度が著しく低下する。
これらの劣化画像を高速にリアルタイムに復元することは、認識性能を高めるための重要な前処理ステップである。
本研究では,交通監視における画像強調作業のために設計されたVRAEアーキテクチャを提案する。
本手法は、各符号化段階で入力認識特徴を注入して表現学習プロセスを導出し、従来のオートエンコーダと比較してネットワーク全体の一般的な情報保存を向上する補助ブロックを用いた拡張戦略を含む。
可視光プレートを用いた車両画像データセット実験により,本手法がAutoencoder(AE),Generative Adversarial Network(GAN),Flow-Based(FB)アプローチを一貫して上回ることを示す。
同じ深さでAEと比較すると、PSNRを約20%改善し、NMSEを約50%削減し、SSIMを1%向上させ、パラメータの辺りの1%しか増加しない。
関連論文リスト
- PocketSR: The Super-Resolution Expert in Your Pocket Mobiles [69.26751136689533]
リアルワールド・イメージ・スーパーレゾリューション (RealSR) は、携帯電話が捉えたような、Wild内の画像の視覚的品質を高めることを目的としている。
大規模な生成モデルを利用する既存の手法は印象的な結果を示しているが、計算コストとレイテンシが高いため、エッジ配置には実用的ではない。
超軽量単一ステップモデルであるPocketSRを導入し,高忠実度を維持しつつ生成モデリング機能をRealSRにもたらす。
論文 参考訳(メタデータ) (2025-10-03T13:56:18Z) - A New Hybrid Model of Generative Adversarial Network and You Only Look Once Algorithm for Automatic License-Plate Recognition [1.6566053195631465]
本稿では,前処理ステップにおけるデブロリングのためのGAN(Generative Adversarial Network)を提案する。
YOLOv5は、ライセンスプレート検出(LPD)と文字認識(CR)の両方で0.026秒の検知時間を達成する。
提案モデルでは, LPD と CR をそれぞれ95%, 97% の精度で検出する。
論文 参考訳(メタデータ) (2025-09-08T16:34:54Z) - Multi-Step Guided Diffusion for Image Restoration on Edge Devices: Toward Lightweight Perception in Embodied AI [0.0]
本稿では,画像品質,知覚精度,一般化を著しく向上させる多段階最適化手法を提案する。
超分解能およびガウス劣化実験により,ステップ毎の勾配更新の増加はLPIPSとPSNRを最小遅延オーバーヘッドで改善することを示した。
我々の発見はMPGDが、ドローンや移動ロボットのような組込みAIエージェントのリアルタイム視覚認識のための軽量でプラグアンドプレイの修復モジュールとしての可能性を強調した。
論文 参考訳(メタデータ) (2025-06-08T21:11:25Z) - Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。
我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。
劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文 参考訳(メタデータ) (2025-04-19T09:54:46Z) - H3AE: High Compression, High Speed, and High Quality AutoEncoder for Video Diffusion Models [76.1519545010611]
オートエンコーダ(AE)は、画像およびビデオ生成のための潜時拡散モデルの成功の鍵である。
本研究では,アーキテクチャ設計の選択について検討し,効率的な高圧縮ビデオAEを得るために計算分布を最適化する。
我々のAEは、モバイル上での超高圧縮比とリアルタイム復号化速度を達成しつつ、再現率の点で先行技術より優れています。
論文 参考訳(メタデータ) (2025-04-14T17:59:06Z) - Improving the Diffusability of Autoencoders [54.920783089085035]
高品質な画像やビデオを生成するための主要なアプローチとして、潜伏拡散モデルが登場している。
我々は、現代のオートエンコーダのスペクトル分析を行い、その潜在空間における不規則な高周波成分を同定する。
我々は、この高周波成分が拡散合成プロセスの粗大な微細な性質に干渉し、生成品質を阻害する仮説を立てた。
論文 参考訳(メタデータ) (2025-02-20T18:45:44Z) - Fast-COS: A Fast One-Stage Object Detector Based on Reparameterized Attention Vision Transformer for Autonomous Driving [3.617580194719686]
本稿では、シーンを駆動するための新しい単一ステージオブジェクト検出フレームワークであるFast-COSを紹介する。
RAViTはImageNet-1Kデータセットで81.4%のTop-1精度を達成した。
主要なモデルの効率を上回り、最大75.9%のGPU推論速度とエッジデバイスでの1.38のスループットを提供する。
論文 参考訳(メタデータ) (2025-02-11T09:54:09Z) - Structured Pruning for Efficient Visual Place Recognition [24.433604332415204]
視覚的位置認識(VPR)は、ロボットや機器のグローバルな再ローカライズに欠かせない。
本稿では,共通VPRアーキテクチャを合理化するための新しい構造化プルーニング手法を提案する。
この二重焦点はシステムの効率を大幅に向上させ、マップとモデルメモリの要求を減らし、特徴抽出と検索待ち時間を短縮する。
論文 参考訳(メタデータ) (2024-09-12T08:32:25Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - MOFA: A Model Simplification Roadmap for Image Restoration on Mobile
Devices [17.54747506334433]
本稿では,展開前の画像復元モデルをさらに高速化するロードマップを提案する。
提案手法は,PSNRとSSIMを増大させながら,ランタイムを最大13%削減し,パラメータ数を最大23%削減する。
論文 参考訳(メタデータ) (2023-08-24T01:29:15Z) - Vehicle Detection and Classification without Residual Calculation:
Accelerating HEVC Image Decoding with Random Perturbation Injection [0.0]
本研究では,HEVCビットストリームからの画像を再構成するランダム摂動に基づく圧縮領域法を提案する。
従来の完全復号化手法と比較して,復元速度が大幅に向上したことを示す。
検出精度は画素領域法に匹敵する99.9%,分類精度96.84%,画素領域法に匹敵する0.98%であった。
論文 参考訳(メタデータ) (2023-05-14T22:04:00Z) - Skip-Attention: Improving Vision Transformers by Paying Less Attention [55.47058516775423]
視覚計算変換器(ViT)は、すべての層で高価な自己注意操作を使用する。
また,SkipAtを提案する。SkipAtは,先行層から自己注意を再利用して1層以上の注意を近似する手法である。
本稿では,画像の分類と自己教師型学習,ADE20Kのセマンティックセグメンテーション,SIDDの画像デノイング,DAVISのビデオデノナイズにおける手法の有効性を示す。
論文 参考訳(メタデータ) (2023-01-05T18:59:52Z) - Efficient Image Super-Resolution using Vast-Receptive-Field Attention [49.87316814164699]
注意機構は、高度な超解像(SR)ネットワークの設計において重要な役割を果たす。
本研究では,アテンション機構の改善により,効率的なSRネットワークを設計する。
VAst-receptive-field Pixel attention networkであるVapSRを提案する。
論文 参考訳(メタデータ) (2022-10-12T07:01:00Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。