論文の概要: UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors
- arxiv url: http://arxiv.org/abs/2511.18152v1
- Date: Sat, 22 Nov 2025 18:44:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.656036
- Title: UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors
- Title(参考訳): UnfoldLDM:遅延拡散前処理による深部展開型ブラインド画像復元
- Authors: Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, CHengyu Fang, Yunlong Lin, Fengyang Xiao, Sina Farsiu,
- Abstract要約: そこで我々は,UnfoldLDMを提案し,深部展開ネットワークと潜時拡散モデル(LDM)を統合してブラインド画像復元を行う。
各段階において、UnfoldLDMは勾配降下ステップとして多粒度劣化認識モジュール(MGDA)を用いる。
本研究では, 劣化抑制型LCM (DR-LDM) を設計し, コンパクトな劣化不変前駆体を抽出する。
このユニークな組み合わせは、最終的な結果が劣化のない、視覚的に豊かなものであることを保証します。
- 参考スコア(独自算出の注目度): 21.35552789229871
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep unfolding networks (DUNs) combine the interpretability of model-based methods with the learning ability of deep networks, yet remain limited for blind image restoration (BIR). Existing DUNs suffer from: (1) \textbf{Degradation-specific dependency}, as their optimization frameworks are tied to a known degradation model, making them unsuitable for BIR tasks; and (2) \textbf{Over-smoothing bias}, resulting from the direct feeding of gradient descent outputs, dominated by low-frequency content, into the proximal term, suppressing fine textures. To overcome these issues, we propose UnfoldLDM to integrate DUNs with latent diffusion model (LDM) for BIR. In each stage, UnfoldLDM employs a multi-granularity degradation-aware (MGDA) module as the gradient descent step. MGDA models BIR as an unknown degradation estimation problem and estimates both the holistic degradation matrix and its decomposed forms, enabling robust degradation removal. For the proximal step, we design a degradation-resistant LDM (DR-LDM) to extract compact degradation-invariant priors from the MGDA output. Guided by this prior, an over-smoothing correction transformer (OCFormer) explicitly recovers high-frequency components and enhances texture details. This unique combination ensures the final result is degradation-free and visually rich. Experiments show that our UnfoldLDM achieves a leading place on various BIR tasks and benefits downstream tasks. Moreover, our design is compatible with existing DUN-based methods, serving as a plug-and-play framework. Code will be released.
- Abstract(参考訳): ディープ・アンフォールディング・ネットワーク(DUN)は、モデルベースの手法の解釈可能性とディープ・ネットワークの学習能力を組み合わせるが、ブラインド・イメージ・リカバリ(BIR)に限られる。
既存の DUN には、(1) \textbf{Degradation-specific dependency} という最適化フレームワークが既知の劣化モデルに結びついているので、BIR タスクには適さない。
これらの課題を克服するため、我々はUnfoldLDMを提案し、BIRのためのDUNと潜在拡散モデル(LDM)を統合する。
各段階において、UnfoldLDMは勾配降下ステップとして多粒度劣化認識モジュール(MGDA)を用いる。
MGDAは、BIRを未知の劣化推定問題としてモデル化し、全体分解行列とその分解形式の両方を推定し、堅牢な劣化除去を可能にする。
近位ステップでは、MGDA出力からコンパクトな劣化不変前駆体を抽出する耐劣化性LDM(DR-LDM)を設計する。
この前もって、OCFormer(Over-smoothing correct transformer)は、高周波数成分を明示的に回収し、テクスチャの詳細を強化する。
このユニークな組み合わせは、最終的な結果が劣化のない、視覚的に豊かなものであることを保証します。
実験の結果、UnfoldLDMは様々なBIRタスクや下流タスクにおいて主要な位置を占めます。
さらに、DUNベースの既存のメソッドと互換性があり、プラグイン・アンド・プレイのフレームワークとして機能します。
コードはリリースされる。
関連論文リスト
- UniLDiff: Unlocking the Power of Diffusion Priors for All-in-One Image Restoration [16.493990086330985]
UniLDiffは、デグレッションとディテールを意識したメカニズムで強化された統合フレームワークである。
劣化認識機能融合(DAFF:Degradation-Aware Feature Fusion)を導入し,低品質機能を各段階に動的に注入する。
また,Detail-Aware Expert Module (DAEM) をデコーダ内に設計し,テクスチャと微細構造の回復性を高める。
論文 参考訳(メタデータ) (2025-07-31T16:02:00Z) - LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling [38.700993166492495]
本稿では,事前学習した潜伏拡散モデルを用いた再帰サンプリングによるデータセットフリーで統一的な手法を提案する。
本手法では,マルチモーダル理解モデルを用いて,タスクブレンド条件下で生成モデルにセマンティックな事前情報を提供する。
論文 参考訳(メタデータ) (2025-07-01T14:25:09Z) - Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models [19.445391508424667]
逆問題(IP)はノイズの観測から信号を再構成する。
DMはIPを解くための強力なフレームワークとして登場し、優れた再構築性能を実現している。
既存のDMベースの手法は、重い計算要求や準最適収束といった問題に頻繁に遭遇する。
これらの課題に対処するために,DMILOとDMILO-PGDという2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2025-05-27T06:49:02Z) - InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.70903819362402]
拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。
我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。
InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文 参考訳(メタデータ) (2025-02-04T10:51:20Z) - DR-BFR: Degradation Representation with Diffusion Models for Blind Face Restoration [7.521850476177286]
低品質 (LQ) の顔画像から様々な劣化を分解する能力を持つ拡散モデルを開発した。
DR-BFRと呼ばれる新しい修復手法は、劣化表現(DR)とLQ画像からのコンテンツ特徴を取り入れることで、遅延拡散モデル(LDM)の認知を導く。
DR-BFRは、様々なデータセットに対して定量的かつ質的に最先端の手法を著しく上回る。
論文 参考訳(メタデータ) (2024-11-15T15:24:42Z) - DORNet: A Degradation Oriented and Regularized Network for Blind Depth Super-Resolution [48.744290794713905]
現実のシナリオでは、キャプチャーされた深度データは、センサーの制限や複雑な撮像環境のために、従来と変わらない劣化に悩まされることが多い。
本稿では,現実のシーンにおける未知の劣化に適応的に対処する新しいフレームワークであるDORNetを提案する。
提案手法は,低解像度深度データの劣化表現をモデル化した自己教師付き劣化学習戦略の開発から始まる。
効率的なRGB-D融合を容易にするために,学習した劣化先行情報に基づいて,RGBコンテンツを奥行きデータに選択的に伝播する劣化指向の特徴変換モジュールを導入する。
論文 参考訳(メタデータ) (2024-10-15T14:53:07Z) - Suppressing Uncertainties in Degradation Estimation for Blind Super-Resolution [31.89605287039615]
ブラインド画像の超解像問題は、未知の劣化モードで低解像度(LR)画像から高解像度(HR)画像を復元することを目的としている。
既存のほとんどの手法は、ぼやけたカーネルを使って画像劣化過程をモデル化している。
盲目的のtextbf Super-textbfResolution フレームワークに対して,textbfUncertainty に基づく分解表現を提案する。
論文 参考訳(メタデータ) (2024-06-24T08:58:43Z) - BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Meta-Learning based Degradation Representation for Blind
Super-Resolution [54.93926549648434]
メタラーニングに基づく地域劣化対応SRネットワーク(MRDA)を提案する。
我々はMRDAを用いて、数回の反復後に特定の複雑な劣化に迅速に適応し、暗黙的な劣化情報を抽出する。
教師ネットワークMRDA$_T$は、SRのためにMLNが抽出した劣化情報をさらに活用するように設計されている。
論文 参考訳(メタデータ) (2022-07-28T09:03:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。