論文の概要: Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model
- arxiv url: http://arxiv.org/abs/2505.18674v1
- Date: Sat, 24 May 2025 12:32:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.584486
- Title: Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model
- Title(参考訳): 内部詳細拡張拡散モデルによるリアルタイム画像の復元
- Authors: Peng Xiao, Hongbo Zhao, Yijun Wang, Jianxin Lin,
- Abstract要約: 古い写真や低解像度画像などの現実世界の劣化画像の復元は、大きな課題となる。
最近のデータ駆動型アプローチは、高忠実度復元と、色付けに対するオブジェクトレベル制御の達成に苦慮している。
実世界の劣化画像の高忠実性復元のための内部詳細保存拡散モデルを提案する。
- 参考スコア(独自算出の注目度): 9.520471615470267
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Restoring real-world degraded images, such as old photographs or low-resolution images, presents a significant challenge due to the complex, mixed degradations they exhibit, such as scratches, color fading, and noise. Recent data-driven approaches have struggled with two main challenges: achieving high-fidelity restoration and providing object-level control over colorization. While diffusion models have shown promise in generating high-quality images with specific controls, they often fail to fully preserve image details during restoration. In this work, we propose an internal detail-preserving diffusion model for high-fidelity restoration of real-world degraded images. Our method utilizes a pre-trained Stable Diffusion model as a generative prior, eliminating the need to train a model from scratch. Central to our approach is the Internal Image Detail Enhancement (IIDE) technique, which directs the diffusion model to preserve essential structural and textural information while mitigating degradation effects. The process starts by mapping the input image into a latent space, where we inject the diffusion denoising process with degradation operations that simulate the effects of various degradation factors. Extensive experiments demonstrate that our method significantly outperforms state-of-the-art models in both qualitative assessments and perceptual quantitative evaluations. Additionally, our approach supports text-guided restoration, enabling object-level colorization control that mimics the expertise of professional photo editing.
- Abstract(参考訳): 古い写真や低解像度画像のような現実世界の劣化画像の復元は、傷、色色、ノイズなどの複雑な、混ざった劣化によって大きな課題を呈している。
最近のデータ駆動型アプローチでは、高忠実度復元の実現と、色付けに対するオブジェクトレベルの制御の2つの主な課題に苦労している。
拡散モデルは、特定の制御で高品質な画像を生成することを約束しているが、復元中に画像の詳細を完全に保存することができないことが多い。
本研究では,実世界の劣化画像の高忠実性復元のための内部詳細保存拡散モデルを提案する。
提案手法では,事前学習した安定拡散モデルを生成前として利用し,スクラッチからモデルをトレーニングする必要がなくなる。
本手法の中心となるのは内部画像強調(IIDE)技術であり, 劣化効果を緩和しつつ, 重要な構造的, テクスチャ的情報を保存するよう拡散モデルに指示する。
このプロセスは入力画像を潜在空間にマッピングすることから始まり、様々な分解因子の効果をシミュレートする劣化操作で拡散分解過程を注入する。
本手法は,定性評価と知覚的定量的評価の両方において,最先端のモデルよりも有意に優れていることを示す。
さらに,本手法はテキストガイドによる復元をサポートし,プロの写真編集の専門知識を模倣したオブジェクトレベルのカラー化制御を可能にする。
関連論文リスト
- FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。
既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。
実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:08:40Z) - Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.69610609088771]
ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。
これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。
本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。
我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文 参考訳(メタデータ) (2024-10-06T20:38:14Z) - Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - Joint Conditional Diffusion Model for Image Restoration with Mixed Degradations [29.14467633167042]
悪天候下における画像復元のための新しい手法を提案する。
大気散乱モデルに基づく混合劣化モデルを用いて, 復元過程全体を導出する。
マルチウェザーおよび気象特化データセットの実験は、最先端の競合手法よりも、我々の手法が優れていることを示す。
論文 参考訳(メタデータ) (2024-04-11T14:07:16Z) - CasSR: Activating Image Power for Real-World Image Super-Resolution [24.152495730507823]
超解像のためのカスケード拡散法CasSRは、高精細でリアルな画像を生成するために設計された新しい方法である。
低解像度画像からの情報の抽出を最適化するカスケード制御可能な拡散モデルを開発した。
論文 参考訳(メタデータ) (2024-03-18T03:59:43Z) - Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:40:38Z) - LLDiffusion: Learning Degradation Representations in Diffusion Models
for Low-Light Image Enhancement [118.83316133601319]
現在の低照度画像強調(LLIE)の深層学習法は、通常、ペア化されたデータから学んだピクセルワイドマッピングに依存している。
本稿では,拡散モデルを用いたLLIEの劣化認識学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-27T07:22:51Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。