論文の概要: LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling
- arxiv url: http://arxiv.org/abs/2507.00790v1
- Date: Tue, 01 Jul 2025 14:25:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.662933
- Title: LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling
- Title(参考訳): LD-RPS:遅延拡散リカレント後方サンプリングによるゼロショット統合画像復元
- Authors: Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu,
- Abstract要約: 本稿では,事前学習した潜伏拡散モデルを用いた再帰サンプリングによるデータセットフリーで統一的な手法を提案する。
本手法では,マルチモーダル理解モデルを用いて,タスクブレンド条件下で生成モデルにセマンティックな事前情報を提供する。
- 参考スコア(独自算出の注目度): 23.886038479359918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unified image restoration is a significantly challenging task in low-level vision. Existing methods either make tailored designs for specific tasks, limiting their generalizability across various types of degradation, or rely on training with paired datasets, thereby suffering from closed-set constraints. To address these issues, we propose a novel, dataset-free, and unified approach through recurrent posterior sampling utilizing a pretrained latent diffusion model. Our method incorporates the multimodal understanding model to provide sematic priors for the generative model under a task-blind condition. Furthermore, it utilizes a lightweight module to align the degraded input with the generated preference of the diffusion model, and employs recurrent refinement for posterior sampling. Extensive experiments demonstrate that our method outperforms state-of-the-art methods, validating its effectiveness and robustness. Our code and data will be available at https://github.com/AMAP-ML/LD-RPS.
- Abstract(参考訳): 統一画像復元は、低レベルの視覚において非常に難しい課題である。
既存の手法では、特定のタスク用に調整された設計を行い、様々な種類の劣化に対して一般化性を制限するか、ペア化されたデータセットによるトレーニングに頼っているため、クローズドセットの制約に悩まされる。
これらの問題に対処するために,事前学習した潜伏拡散モデルを用いて,再帰的後続サンプリングによる新しい,データセットフリーで統一的なアプローチを提案する。
本手法では,マルチモーダル理解モデルを用いて,タスクブレンド条件下で生成モデルにセマンティックな事前情報を提供する。
さらに、軽量モジュールを用いて、劣化した入力と拡散モデルの生成した嗜好を整合させ、後続サンプリングに繰り返し改善する。
大規模な実験により,本手法は最先端の手法よりも優れ,その有効性と堅牢性を検証した。
コードとデータはhttps://github.com/AMAP-ML/LD-RPS.comで公開されます。
関連論文リスト
- Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual [47.141811103506036]
我々はDualにおけるReconciling Model(RDMD)と呼ばれる新しいゼロショット画像復元手法を提案する。
RDMDはbftextsingle事前学習拡散モデルのみを使用してテキスト2正規化器を構成する。
提案手法は,FFHQ と ImageNet の両方のデータセットに対する既存手法と比較して,優れた結果が得られる。
論文 参考訳(メタデータ) (2025-03-03T08:25:22Z) - Rejection Sampling IMLE: Designing Priors for Better Few-Shot Image
Synthesis [7.234618871984921]
新たな研究分野は、限られたトレーニングデータで深層生成モデルを学ぶことを目的としている。
トレーニングに使用する事前分布を変更する新しいアプローチであるRS-IMLEを提案する。
これにより、既存のGANやIMLEベースの手法に比べて画質が大幅に向上する。
論文 参考訳(メタデータ) (2024-09-26T00:19:42Z) - Ambient Diffusion Posterior Sampling: Solving Inverse Problems with Diffusion Models Trained on Corrupted Data [54.09959775518994]
線形に破損したデータから学習した拡散モデルを用いて逆問題を解決するためのフレームワークを提供する。
加速度係数R=2,4,6,8のサブサンプルによるマルチコイル測定にのみアクセス可能なMRI拡散モデルを訓練する。
高加速度環境下でのMRI再構成において、サブサンプルデータでトレーニングされたA-DPSモデルは、完全サンプルデータでトレーニングされたモデルよりも逆問題の解決に適している。
論文 参考訳(メタデータ) (2024-03-13T17:28:20Z) - Exploiting Diffusion Prior for Real-World Image Super-Resolution [75.5898357277047]
本稿では,事前学習したテキスト・画像拡散モデルにカプセル化された事前知識を視覚的超解像に活用するための新しいアプローチを提案する。
時間認識エンコーダを用いることで、事前学習した合成モデルを変更することなく、有望な復元結果が得られる。
論文 参考訳(メタデータ) (2023-05-11T17:55:25Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。