Fugu-MT 論文翻訳(概要): Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model

論文の概要: Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model

arxiv url: http://arxiv.org/abs/2505.18674v1
Date: Sat, 24 May 2025 12:32:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:42.584486
Title: Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model
Title（参考訳）: 内部詳細拡張拡散モデルによるリアルタイム画像の復元
Authors: Peng Xiao, Hongbo Zhao, Yijun Wang, Jianxin Lin,
Abstract要約: 古い写真や低解像度画像などの現実世界の劣化画像の復元は、大きな課題となる。最近のデータ駆動型アプローチは、高忠実度復元と、色付けに対するオブジェクトレベル制御の達成に苦慮している。実世界の劣化画像の高忠実性復元のための内部詳細保存拡散モデルを提案する。
参考スコア（独自算出の注目度）: 9.520471615470267
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Restoring real-world degraded images, such as old photographs or low-resolution images, presents a significant challenge due to the complex, mixed degradations they exhibit, such as scratches, color fading, and noise. Recent data-driven approaches have struggled with two main challenges: achieving high-fidelity restoration and providing object-level control over colorization. While diffusion models have shown promise in generating high-quality images with specific controls, they often fail to fully preserve image details during restoration. In this work, we propose an internal detail-preserving diffusion model for high-fidelity restoration of real-world degraded images. Our method utilizes a pre-trained Stable Diffusion model as a generative prior, eliminating the need to train a model from scratch. Central to our approach is the Internal Image Detail Enhancement (IIDE) technique, which directs the diffusion model to preserve essential structural and textural information while mitigating degradation effects. The process starts by mapping the input image into a latent space, where we inject the diffusion denoising process with degradation operations that simulate the effects of various degradation factors. Extensive experiments demonstrate that our method significantly outperforms state-of-the-art models in both qualitative assessments and perceptual quantitative evaluations. Additionally, our approach supports text-guided restoration, enabling object-level colorization control that mimics the expertise of professional photo editing.
Abstract（参考訳）: 古い写真や低解像度画像のような現実世界の劣化画像の復元は、傷、色色、ノイズなどの複雑な、混ざった劣化によって大きな課題を呈している。最近のデータ駆動型アプローチでは、高忠実度復元の実現と、色付けに対するオブジェクトレベルの制御の2つの主な課題に苦労している。拡散モデルは、特定の制御で高品質な画像を生成することを約束しているが、復元中に画像の詳細を完全に保存することができないことが多い。本研究では,実世界の劣化画像の高忠実性復元のための内部詳細保存拡散モデルを提案する。提案手法では,事前学習した安定拡散モデルを生成前として利用し,スクラッチからモデルをトレーニングする必要がなくなる。本手法の中心となるのは内部画像強調(IIDE)技術であり, 劣化効果を緩和しつつ, 重要な構造的, テクスチャ的情報を保存するよう拡散モデルに指示する。このプロセスは入力画像を潜在空間にマッピングすることから始まり、様々な分解因子の効果をシミュレートする劣化操作で拡散分解過程を注入する。本手法は,定性評価と知覚的定量的評価の両方において,最先端のモデルよりも有意に優れていることを示す。さらに,本手法はテキストガイドによる復元をサポートし,プロの写真編集の専門知識を模倣したオブジェクトレベルのカラー化制御を可能にする。

関連論文リスト

Unlocking the Potential of Diffusion Priors in Blind Face Restoration [63.419272650578165]
本研究では、2つのモードを切り替えて特定のギャップを解消する統合ネットワークFLIPNETを提案する。復元モードでは、モデルは徐々にBFR指向の特徴とLQ画像からの顔埋め込みを統合し、真正かつ忠実な顔復元を実現する。劣化モードでは、実際の劣化データセットから学んだ知識に基づいて、劣化した画像のような現実世界を合成する。
論文参考訳（メタデータ） (2025-08-12T01:50:55Z)
TDiR: Transformer based Diffusion for Image Restoration Tasks [19.992144590243836]
難易度の高い環境で撮影された画像は、ノイズ、カラーキャスト、ぼかし、光散乱など、様々な種類の劣化を経験することが多い。これらの効果は、画像の品質を著しく低下させ、オブジェクトの検出、マッピング、分類といった下流タスクの適用性を阻害する。画像復元作業に対処し,劣化画像の品質向上を目的としたトランスフォーマーベース拡散モデルを開発した。
論文参考訳（メタデータ） (2025-06-25T10:28:13Z)
FoundIR: Unleashing Million-scale Training Data to Advance Foundation Models for Image Restoration [66.61201445650323]
既存の手法は現実のシナリオにおける一般化ボトルネックに悩まされる。既存のトレーニングデータに対して,2つの大きなメリットがある,100万規模のデータセットをコントリビュートしています。実世界のシナリオにおいて,より広範囲の復元作業に対処するために,ロバストなモデルFoundIRを提案する。
論文参考訳（メタデータ） (2024-12-02T12:08:40Z)
Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.69610609088771]
ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文参考訳（メタデータ） (2024-10-06T20:38:14Z)
Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文参考訳（メタデータ） (2024-07-04T05:01:10Z)
Joint Conditional Diffusion Model for Image Restoration with Mixed Degradations [29.14467633167042]
悪天候下における画像復元のための新しい手法を提案する。大気散乱モデルに基づく混合劣化モデルを用いて, 復元過程全体を導出する。マルチウェザーおよび気象特化データセットの実験は、最先端の競合手法よりも、我々の手法が優れていることを示す。
論文参考訳（メタデータ） (2024-04-11T14:07:16Z)
CasSR: Activating Image Power for Real-World Image Super-Resolution [24.152495730507823]
超解像のためのカスケード拡散法CasSRは、高精細でリアルな画像を生成するために設計された新しい方法である。低解像度画像からの情報の抽出を最適化するカスケード制御可能な拡散モデルを開発した。
論文参考訳（メタデータ） (2024-03-18T03:59:43Z)
Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文参考訳（メタデータ） (2023-08-28T08:47:06Z)
Diffusion Models for Image Restoration and Enhancement -- A Comprehensive Survey [96.99328714941657]
本稿では,近年の拡散モデルに基づく画像復元手法について概観する。我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文参考訳（メタデータ） (2023-08-18T08:40:38Z)
LLDiffusion: Learning Degradation Representations in Diffusion Models for Low-Light Image Enhancement [118.83316133601319]
現在の低照度画像強調(LLIE)の深層学習法は、通常、ペア化されたデータから学んだピクセルワイドマッピングに依存している。本稿では,拡散モデルを用いたLLIEの劣化認識学習手法を提案する。
論文参考訳（メタデータ） (2023-07-27T07:22:51Z)
DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文参考訳（メタデータ） (2023-03-13T06:05:18Z)
ShadowDiffusion: When Degradation Prior Meets Diffusion Model for Shadow Removal [74.86415440438051]
画像と劣化先行情報を統合した統合拡散フレームワークを提案する。 SRDデータセット上でのPSNRは31.69dBから34.73dBへと大幅に向上した。
論文参考訳（メタデータ） (2022-12-09T07:48:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。