論文の概要: Visual-Instructed Degradation Diffusion for All-in-One Image Restoration
- arxiv url: http://arxiv.org/abs/2506.16960v1
- Date: Fri, 20 Jun 2025 12:50:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.445468
- Title: Visual-Instructed Degradation Diffusion for All-in-One Image Restoration
- Title(参考訳): オールインワン画像復元のための視覚指示型劣化拡散
- Authors: Wenyang Luo, Haina Qin, Zewen Chen, Libin Wang, Dandan Zheng, Yuming Li, Yufan Liu, Bing Li, Weiming Hu,
- Abstract要約: 視覚指導誘導劣化拡散を利用したオールインワン画像復元フレームワークである textbfDefusion を提案する。
Defusionは複雑な画像復元タスクや実世界の劣化など、さまざまな画像復元タスクにおいて、最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 29.910376294021052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image restoration tasks like deblurring, denoising, and dehazing usually need distinct models for each degradation type, restricting their generalization in real-world scenarios with mixed or unknown degradations. In this work, we propose \textbf{Defusion}, a novel all-in-one image restoration framework that utilizes visual instruction-guided degradation diffusion. Unlike existing methods that rely on task-specific models or ambiguous text-based priors, Defusion constructs explicit \textbf{visual instructions} that align with the visual degradation patterns. These instructions are grounded by applying degradations to standardized visual elements, capturing intrinsic degradation features while agnostic to image semantics. Defusion then uses these visual instructions to guide a diffusion-based model that operates directly in the degradation space, where it reconstructs high-quality images by denoising the degradation effects with enhanced stability and generalizability. Comprehensive experiments demonstrate that Defusion outperforms state-of-the-art methods across diverse image restoration tasks, including complex and real-world degradations.
- Abstract(参考訳): デブロアリング(deblurring)、デノイング(denoising)、デハジング(dehazing)といったイメージ復元タスクは、通常、分解タイプごとに異なるモデルを必要とし、混合または未知の劣化を伴う現実のシナリオにおけるそれらの一般化を制限する。
本研究では,視覚指導誘導劣化拡散を利用したオールインワン画像復元フレームワークである \textbf{Defusion} を提案する。
タスク固有のモデルや曖昧なテキストベースの事前処理に依存する既存のメソッドとは異なり、Defusionは視覚的な劣化パターンに合わせて明示的な \textbf{visual instructions} を構築している。
これらの命令は、標準化された視覚要素に劣化を適用し、固有の劣化特徴をキャプチャし、画像意味論に依存しない。
次に、デフュージョンはこれらの視覚的指示を用いて、拡散モデル(拡散モデル)を誘導し、分解空間内で直接動作し、分解効果を改良された安定性と一般化性で復調することで高品質な画像を再構成する。
総合的な実験により、Defusionは複雑で現実的な劣化を含む様々な画像復元タスクにおいて最先端の手法より優れていることが示された。
関連論文リスト
- UniRes: Universal Image Restoration for Complex Degradations [53.74404005987783]
実世界のイメージ復元は、様々なキャプチャ条件、キャプチャデバイス、後処理パイプラインから生じるさまざまな劣化によって妨げられている。
UniResという名前の、シンプルで柔軟な拡散ベースのフレームワークは、このような劣化をエンドツーエンドで解決するために提案されている。
提案手法は, 複合劣化画像復元データセットと単分解画像復元データセットの両方を用いて評価する。
論文 参考訳(メタデータ) (2025-06-05T21:25:39Z) - AllRestorer: All-in-One Transformer for Image Restoration under Composite Degradations [52.076067325999226]
本稿では,新しいトランスフォーマーベースの復元フレームワークAllRestorerを提案する。
AllRestorerは、すべてのイメージ障害を適応的に考慮し、シーンディスクリプタのミスダイレクトによるエラーを避ける。
CDD-11データセットのベースラインと比較して,AllRestorerはPSNRの5.00dB増加を実現している。
論文 参考訳(メタデータ) (2024-11-16T05:30:55Z) - OneRestore: A Universal Restoration Framework for Composite Degradation [33.556183375565034]
現実のシナリオでは、画像障害はしばしば複合的な劣化として現れ、低光、迷路、雨、雪といった要素の複雑な相互作用を示す。
本研究では, 複雑な複合劣化シナリオを正確に表現するために, 4つの物理劣化パラダイムを統合した多目的イメージングモデルを提案する。
OneRestoreは、適応的で制御可能なシーン復元のために設計された新しいトランスフォーマーベースのフレームワークである。
論文 参考訳(メタデータ) (2024-07-05T16:27:00Z) - Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - DaLPSR: Leverage Degradation-Aligned Language Prompt for Real-World Image Super-Resolution [19.33582308829547]
本稿では, 精度, 精細度, 高忠実度画像復元のために, 劣化対応言語プロンプトを活用することを提案する。
提案手法は,新しい最先端の知覚品質レベルを実現する。
論文 参考訳(メタデータ) (2024-06-24T09:30:36Z) - All-in-one Multi-degradation Image Restoration Network via Hierarchical
Degradation Representation [47.00239809958627]
我々は新しいオールインワン・マルチデグレーション画像復元ネットワーク(AMIRNet)を提案する。
AMIRNetは、クラスタリングによって木構造を段階的に構築することで、未知の劣化画像の劣化表現を学習する。
この木構造表現は、様々な歪みの一貫性と不一致を明示的に反映しており、画像復元の具体的な手がかりとなっている。
論文 参考訳(メタデータ) (2023-08-06T04:51:41Z) - PromptIR: Prompting for All-in-One Blind Image Restoration [64.02374293256001]
我々は、オールインワン画像復元のためのプロンプトIR(PromptIR)を提案する。
本手法では, 劣化特異的情報をエンコードするプロンプトを用いて, 復元ネットワークを動的に案内する。
PromptIRは、軽量なプロンプトがほとんどない汎用的で効率的なプラグインモジュールを提供する。
論文 参考訳(メタデータ) (2023-06-22T17:59:52Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。