論文の概要: Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement
- arxiv url: http://arxiv.org/abs/2510.07961v1
- Date: Thu, 09 Oct 2025 08:54:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.968682
- Title: Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement
- Title(参考訳): ラテントハーモニー:ラテント空間規則化と制御可能なリファインメントによる相乗的統一UHD画像復元
- Authors: Yidi Liu, Xueyang Fu, Jie Huang, Jie Xiao, Dong Li, Wenlong Zhang, Lei Bai, Zheng-Jun Zha,
- Abstract要約: LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
- 参考スコア(独自算出の注目度): 89.99237142387655
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-High Definition (UHD) image restoration faces a trade-off between computational efficiency and high-frequency detail retention. While Variational Autoencoders (VAEs) improve efficiency via latent-space processing, their Gaussian constraint often discards degradation-specific high-frequency information, hurting reconstruction fidelity. To overcome this, we propose Latent Harmony, a two-stage framework that redefines VAEs for UHD restoration by jointly regularizing the latent space and enforcing high-frequency-aware reconstruction.In Stage One, we introduce LH-VAE, which enhances semantic robustness through visual semantic constraints and progressive degradation perturbations, while latent equivariance strengthens high-frequency reconstruction.Stage Two jointly trains this refined VAE with a restoration model using High-Frequency Low-Rank Adaptation (HF-LoRA): an encoder LoRA guided by a fidelity-oriented high-frequency alignment loss to recover authentic details, and a decoder LoRA driven by a perception-oriented loss to synthesize realistic textures. Both LoRA modules are trained via alternating optimization with selective gradient propagation to preserve the pretrained latent structure.At inference, a tunable parameter {\alpha} enables flexible fidelity-perception trade-offs.Experiments show Latent Harmony achieves state-of-the-art performance across UHD and standard-resolution tasks, effectively balancing efficiency, perceptual quality, and reconstruction accuracy.
- Abstract(参考訳): Ultra-High Definition (UHD)画像復元は、計算効率と高周波詳細保持のトレードオフに直面している。
変分オートエンコーダ(VAE)は遅延空間処理により効率を向上するが、ガウスの制約はしばしば劣化固有の高周波情報を破棄し、再構成の忠実さを損なう。
この問題を解決するために,我々は,UHD修復のためのVAEを再定義する2段階フレームワークであるLatent Harmonyを提案する。LH-VAEは,視覚的意味的制約や進行的劣化による意味的ロバスト性を向上する一方,遅延分散は高周波再構成を強化する。この2つの共同訓練は,高周波数低ランク適応(HF-LoRA):忠実さ指向の高次アライメント損失によって導かれるエンコーダLoRAと,視覚的なテクスチャを再現するために,視覚的指向のロスによって駆動されるデコーダLoRAである。
両方のLORAモジュールは、事前訓練された潜在構造を保存するために、選択的な勾配伝搬による最適化によって訓練され、チューナブルパラメータ {\alpha {\displaystyle {\alpha} はフレキシブルなフィデリティ知覚トレードオフを可能にし、実験により、UHDおよび標準解像度タスク間で最先端のパフォーマンスを達成し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
関連論文リスト
- Progressive Flow-inspired Unfolding for Spectral Compressive Imaging [11.638690628451647]
符号化開口スナップショット分光画像(CASSI)は、単一の2次元圧縮計測から3次元ハイパースペクトル画像(HSI)を取得する。
近年の深層展開ネットワーク (DUN) はCASSI再建の最先端を達成している。
拡散軌跡と流れの整合性に着想を得て,新しい軌道制御可能な展開フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-15T16:10:50Z) - Latent Wavelet Diffusion For Ultra-High-Resolution Image Synthesis [56.311477476580926]
超高分解能(2K-4K)画像合成におけるディテールとテクスチャの忠実度を大幅に向上させる軽量トレーニングフレームワークであるLatent Wavelet Diffusion (LWD)を提案する。
LWDはウェーブレットエネルギーマップから導かれる新しい周波数対応マスキング戦略を導入し、潜在空間の詳細な領域にトレーニングプロセスを動的に焦点をあてる。
論文 参考訳(メタデータ) (2025-05-31T07:28:32Z) - LAFR: Efficient Diffusion-based Blind Face Restoration via Latent Codebook Alignment Adapter [52.93785843453579]
低品質(LQ)画像からのブラインド顔復元は、高忠実度画像再構成と顔認証の保存を必要とする課題である。
LAFRは,LQ画像の潜時分布とHQ画像の潜時分布を一致させる,新しいコードブックベースの潜時空間アダプタである。
FFHQデータセットのわずか0.9%での拡散の軽量な微調整は、最先端の手法に匹敵する結果を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2025-05-29T14:11:16Z) - From Zero to Detail: Deconstructing Ultra-High-Definition Image Restoration from Progressive Spectral Perspective [38.94762644896294]
ERRは、ゼロ周波増幅器(ZFE)、低周波復元器(LFR)、高周波精製器(HFR)の3つの共同サブネットワークからなる。
具体的には、ZFEはグローバルな事前情報を統合してグローバルマッピングを学習し、LFRは低周波情報を復元し、粗い内容の再構成を強調する。
HFRは、我々の設計した周波数窓付きコルモゴロフアーノルドネットワーク(FW-KAN)を用いてテクスチャやディテールを洗練し、高品質な画像復元を実現している。
論文 参考訳(メタデータ) (2025-03-17T13:39:51Z) - Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising [16.43285056788183]
再構成・生成拡散モデル(Reconstruct-and-Generate Diffusion Model, RnG)と呼ばれる新しい手法を提案する。
提案手法は, 再構成型復調ネットワークを利用して, 基礎となるクリーン信号の大半を復元する。
拡散アルゴリズムを用いて残留する高周波の詳細を生成し、視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-09-19T16:01:20Z) - HDNet: High-resolution Dual-domain Learning for Spectral Compressive
Imaging [138.04956118993934]
HSI再構成のための高分解能デュアルドメイン学習ネットワーク(HDNet)を提案する。
一方、高効率な特徴融合によるHR空間スペクトルアテンションモジュールは、連続的かつ微細な画素レベルの特徴を提供する。
一方、HSI再構成のために周波数領域学習(FDL)を導入し、周波数領域の差を狭める。
論文 参考訳(メタデータ) (2022-03-04T06:37:45Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z) - Non-local Meets Global: An Iterative Paradigm for Hyperspectral Image
Restoration [66.68541690283068]
ハイパースペクトル画像復元のための空間特性とスペクトル特性を組み合わせた統一パラダイムを提案する。
提案するパラダイムは,非局所空間デノゲーションと光計算の複雑さから,性能上の優位性を享受する。
HSI復調、圧縮再構成、塗装タスクの実験は、シミュレーションと実際のデータセットの両方で、その優位性を示している。
論文 参考訳(メタデータ) (2020-10-24T15:53:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。