論文の概要: Multiple Latent Space Mapping for Compressed Dark Image Enhancement
- arxiv url: http://arxiv.org/abs/2403.07622v1
- Date: Tue, 12 Mar 2024 13:05:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 21:22:17.564007
- Title: Multiple Latent Space Mapping for Compressed Dark Image Enhancement
- Title(参考訳): 圧縮暗画像強調のための多重潜在空間マッピング
- Authors: Yi Zeng, Zhengning Wang, Yuxuan Liu, Tianjiao Zeng, Xuhang Liu,
Xinglong Luo, Shuaicheng Liu, Shuyuan Zhu and Bing Zeng
- Abstract要約: 既存の暗黒画像強調手法は、圧縮された暗黒画像を入力とし、優れた性能を実現する。
可変オートエンコーダ(VAE)に基づく新しい潜時マッピングネットワークを提案する。
総合的な実験により,提案手法は圧縮暗画像強調における最先端性能を実現することを示した。
- 参考スコア(独自算出の注目度): 51.112925890246444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dark image enhancement aims at converting dark images to normal-light images.
Existing dark image enhancement methods take uncompressed dark images as inputs
and achieve great performance. However, in practice, dark images are often
compressed before storage or transmission over the Internet. Current methods
get poor performance when processing compressed dark images. Artifacts hidden
in the dark regions are amplified by current methods, which results in
uncomfortable visual effects for observers. Based on this observation, this
study aims at enhancing compressed dark images while avoiding compression
artifacts amplification. Since texture details intertwine with compression
artifacts in compressed dark images, detail enhancement and blocking artifacts
suppression contradict each other in image space. Therefore, we handle the task
in latent space. To this end, we propose a novel latent mapping network based
on variational auto-encoder (VAE). Firstly, different from previous VAE-based
methods with single-resolution features only, we exploit multiple latent spaces
with multi-resolution features, to reduce the detail blur and improve image
fidelity. Specifically, we train two multi-level VAEs to project compressed
dark images and normal-light images into their latent spaces respectively.
Secondly, we leverage a latent mapping network to transform features from
compressed dark space to normal-light space. Specifically, since the
degradation models of darkness and compression are different from each other,
the latent mapping process is divided mapping into enlightening branch and
deblocking branch. Comprehensive experiments demonstrate that the proposed
method achieves state-of-the-art performance in compressed dark image
enhancement.
- Abstract(参考訳): ダークイメージの強化は、ダークイメージを通常の光画像に変換することを目的としている。
既存の暗画像強調法は、未圧縮の暗画像を入力として、優れた性能を達成する。
しかし実際には、暗い画像はインターネット上の保存や送信の前に圧縮されることが多い。
圧縮された暗画像を処理する場合、現在の手法は性能が低下する。
暗黒領域に隠された人工物は、現在の方法で増幅され、観察者にとって不快な視覚効果をもたらす。
本研究は,圧縮アーチファクトの増幅を回避しつつ,圧縮黒画像の強調を目的とした。
テクスチャの詳細は圧縮された暗画像の圧縮アーティファクトと相互作用するため、ディテールエンハンスメントとブロッキングアーティファクトの抑制は画像空間で相反する。
したがって、このタスクを潜在空間で処理する。
そこで本研究では,変分自動エンコーダ(VAE)に基づく新しい潜時マッピングネットワークを提案する。
まず,単一解像度機能のみを持つ従来のvaeベースの手法と異なり,マルチ解像度機能を持つ複数の潜在空間を活用し,ディテールのぼやけを低減し,画像の忠実度を向上させる。
具体的には、2つの多レベルvaを訓練して、それぞれ圧縮された暗画像と常光画像を潜在空間に投影する。
第2に,潜在性マッピングネットワークを利用して,圧縮された暗空間から通常の光空間へ特徴を変換する。
具体的には、暗さと圧縮の劣化モデルは互いに異なるので、潜在写像過程を照明分岐と遮蔽分岐に分割する。
総合的な実験により,提案手法は圧縮暗画像強調における最先端性能を実現することを示した。
関連論文リスト
- You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Deep Metric Color Embeddings for Splicing Localization in Severely
Degraded Images [10.091921099426294]
本研究では,画像に最適なスプライシング検出法を提案する。
我々は、照明色やカメラの白点推定に敏感な深度距離空間を学習するが、一方、対象色の変化には敏感である。
本評価では,強い圧縮とダウンサンプリングの対象となる画像に対して,提案手法の組込み空間が技量を上回り,その性能が向上することを示す。
論文 参考訳(メタデータ) (2022-06-21T21:28:40Z) - Metric Learning for Anti-Compression Facial Forgery Detection [32.33501564446107]
新規な抗圧縮顔面フォージェリー検出フレームワークを提案する。
オリジナル版と圧縮版の両方を使って、圧縮に敏感な埋め込み機能空間を学習する。
論文 参考訳(メタデータ) (2021-03-15T14:11:14Z) - Lossy Image Compression with Normalizing Flows [19.817005399746467]
ディープ・イメージ・圧縮のための最先端のソリューションは、通常、入力を低次元の潜在空間にマッピングするオートエンコーダを用いる。
対照的に、画像圧縮における従来のアプローチは、より幅広い品質レベルを実現する。
論文 参考訳(メタデータ) (2020-08-24T14:46:23Z) - What's in the Image? Explorable Decoding of Compressed Images [45.22726784749359]
ユビキタスJPEG標準のための新しいデコーダアーキテクチャを開発し、圧縮された画像の集合をトラバースする。
我々は、グラフィカル、医学的、法医学的なユースケースに関する我々のフレームワークを例示し、その幅広い潜在的な応用を実証する。
論文 参考訳(メタデータ) (2020-06-16T17:15:44Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。