論文の概要: VRAE: Vertical Residual Autoencoder for License Plate Denoising and Deblurring
- arxiv url: http://arxiv.org/abs/2509.08392v1
- Date: Wed, 10 Sep 2025 08:35:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.361783
- Title: VRAE: Vertical Residual Autoencoder for License Plate Denoising and Deblurring
- Title(参考訳): VRAE: ナンバープレートのデノイングとデブロアリングのための垂直残像自動エンコーダ
- Authors: Cuong Nguyen, Dung T. Tran, Hong Nguyen, Xuan-Vu Phan, Nam-Phong Nguyen,
- Abstract要約: 劣化した画像を高速にリアルタイムに復元することは、認識性能を高めるための重要な前処理ステップである。
本研究では,交通監視における画像強調作業のための垂直残差オートエンコーダアーキテクチャを提案する。
可視光プレートを用いた車両画像データセット実験により,本手法がAutoencoder(AE),Generative Adversarial Network(GAN),Flow-Based(FB)アプローチを一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 2.1639459844313564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In real-world traffic surveillance, vehicle images captured under adverse weather, poor lighting, or high-speed motion often suffer from severe noise and blur. Such degradations significantly reduce the accuracy of license plate recognition systems, especially when the plate occupies only a small region within the full vehicle image. Restoring these degraded images a fast realtime manner is thus a crucial pre-processing step to enhance recognition performance. In this work, we propose a Vertical Residual Autoencoder (VRAE) architecture designed for the image enhancement task in traffic surveillance. The method incorporates an enhancement strategy that employs an auxiliary block, which injects input-aware features at each encoding stage to guide the representation learning process, enabling better general information preservation throughout the network compared to conventional autoencoders. Experiments on a vehicle image dataset with visible license plates demonstrate that our method consistently outperforms Autoencoder (AE), Generative Adversarial Network (GAN), and Flow-Based (FB) approaches. Compared with AE at the same depth, it improves PSNR by about 20\%, reduces NMSE by around 50\%, and enhances SSIM by 1\%, while requiring only a marginal increase of roughly 1\% in parameters.
- Abstract(参考訳): 現実世界の交通監視では、悪天候下で撮影された車両の画像、照明の弱さ、または高速な動きは、しばしば激しい騒音とぼやけに悩まされる。
このような劣化により、ナンバープレート認識システムの精度が著しく低下する。
これらの劣化画像を高速にリアルタイムに復元することは、認識性能を高めるための重要な前処理ステップである。
本研究では,交通監視における画像強調作業のために設計されたVRAEアーキテクチャを提案する。
本手法は、各符号化段階で入力認識特徴を注入して表現学習プロセスを導出し、従来のオートエンコーダと比較してネットワーク全体の一般的な情報保存を向上する補助ブロックを用いた拡張戦略を含む。
可視光プレートを用いた車両画像データセット実験により,本手法がAutoencoder(AE),Generative Adversarial Network(GAN),Flow-Based(FB)アプローチを一貫して上回ることを示す。
同じ深さでAEと比較すると、PSNRを約20 %改善し、NMSEを約50 %削減し、SSIMを約1 %増加させながらSSIMを約1 %向上させる。
関連論文リスト
- Multi-Step Guided Diffusion for Image Restoration on Edge Devices: Toward Lightweight Perception in Embodied AI [0.0]
本稿では,画像品質,知覚精度,一般化を著しく向上させる多段階最適化手法を提案する。
超分解能およびガウス劣化実験により,ステップ毎の勾配更新の増加はLPIPSとPSNRを最小遅延オーバーヘッドで改善することを示した。
我々の発見はMPGDが、ドローンや移動ロボットのような組込みAIエージェントのリアルタイム視覚認識のための軽量でプラグアンドプレイの修復モジュールとしての可能性を強調した。
論文 参考訳(メタデータ) (2025-06-08T21:11:25Z) - Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。
我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。
劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文 参考訳(メタデータ) (2025-04-19T09:54:46Z) - H3AE: High Compression, High Speed, and High Quality AutoEncoder for Video Diffusion Models [76.1519545010611]
オートエンコーダ(AE)は、画像およびビデオ生成のための潜時拡散モデルの成功の鍵である。
本研究では,アーキテクチャ設計の選択について検討し,効率的な高圧縮ビデオAEを得るために計算分布を最適化する。
我々のAEは、モバイル上での超高圧縮比とリアルタイム復号化速度を達成しつつ、再現率の点で先行技術より優れています。
論文 参考訳(メタデータ) (2025-04-14T17:59:06Z) - Improving the Diffusability of Autoencoders [54.920783089085035]
高品質な画像やビデオを生成するための主要なアプローチとして、潜伏拡散モデルが登場している。
我々は、現代のオートエンコーダのスペクトル分析を行い、その潜在空間における不規則な高周波成分を同定する。
我々は、この高周波成分が拡散合成プロセスの粗大な微細な性質に干渉し、生成品質を阻害する仮説を立てた。
論文 参考訳(メタデータ) (2025-02-20T18:45:44Z) - MOFA: A Model Simplification Roadmap for Image Restoration on Mobile
Devices [17.54747506334433]
本稿では,展開前の画像復元モデルをさらに高速化するロードマップを提案する。
提案手法は,PSNRとSSIMを増大させながら,ランタイムを最大13%削減し,パラメータ数を最大23%削減する。
論文 参考訳(メタデータ) (2023-08-24T01:29:15Z) - Vehicle Detection and Classification without Residual Calculation:
Accelerating HEVC Image Decoding with Random Perturbation Injection [0.0]
本研究では,HEVCビットストリームからの画像を再構成するランダム摂動に基づく圧縮領域法を提案する。
従来の完全復号化手法と比較して,復元速度が大幅に向上したことを示す。
検出精度は画素領域法に匹敵する99.9%,分類精度96.84%,画素領域法に匹敵する0.98%であった。
論文 参考訳(メタデータ) (2023-05-14T22:04:00Z) - Skip-Attention: Improving Vision Transformers by Paying Less Attention [55.47058516775423]
視覚計算変換器(ViT)は、すべての層で高価な自己注意操作を使用する。
また,SkipAtを提案する。SkipAtは,先行層から自己注意を再利用して1層以上の注意を近似する手法である。
本稿では,画像の分類と自己教師型学習,ADE20Kのセマンティックセグメンテーション,SIDDの画像デノイング,DAVISのビデオデノナイズにおける手法の有効性を示す。
論文 参考訳(メタデータ) (2023-01-05T18:59:52Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。