論文の概要: Zero-shot Adaptation of Stable Diffusion via Plug-in Hierarchical Degradation Representation for Real-World Super-Resolution
- arxiv url: http://arxiv.org/abs/2512.10340v1
- Date: Thu, 11 Dec 2025 06:45:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.228522
- Title: Zero-shot Adaptation of Stable Diffusion via Plug-in Hierarchical Degradation Representation for Real-World Super-Resolution
- Title(参考訳): 実世界の超解像に対するプラグイン階層分解表現による安定拡散のゼロショット適応
- Authors: Yi-Cheng Liao, Shyang-En Weng, Yu-Syuan Xu, Chi-Wei Hsiao, Wei-Chen Chiu, Ching-Chun Huang,
- Abstract要約: Real-World Image Super-Resolutionは、未知の複雑な実世界の要因によって劣化した低品質な入力から高品質なイメージを復元することを目的としている。
textbfHD-CLIP (textbfHierarchical textbfDegradation CLIP)は、低品質の画像をセマンティック埋め込みに分解する。
textbfCLIPは、トレーニングなしで様々な超解像度フレームワークにシームレスに統合できる。
- 参考スコア(独自算出の注目度): 22.82705867627899
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-World Image Super-Resolution (Real-ISR) aims to recover high-quality images from low-quality inputs degraded by unknown and complex real-world factors. Real-world scenarios involve diverse and coupled degradations, making it necessary to provide diffusion models with richer and more informative guidance. However, existing methods often assume known degradation severity and rely on CLIP text encoders that cannot capture numerical severity, limiting their generalization ability. To address this, we propose \textbf{HD-CLIP} (\textbf{H}ierarchical \textbf{D}egradation CLIP), which decomposes a low-quality image into a semantic embedding and an ordinal degradation embedding that captures ordered relationships and allows interpolation across unseen levels. Furthermore, we integrated it into diffusion models via classifier-free guidance (CFG) and proposed classifier-free projection guidance (CFPG). HD-CLIP leverages semantic cues to guide generative restoration while using degradation cues to suppress undesired hallucinations and artifacts. As a \textbf{plug-and-play module}, HD-CLIP can be seamlessly integrated into various super-resolution frameworks without training, significantly improving detail fidelity and perceptual realism across diverse real-world datasets.
- Abstract(参考訳): Real-World Image Super-Resolution (Real-ISR)は、未知の複雑な実世界の要因によって劣化した低品質な入力から高品質なイメージを復元することを目的としている。
現実世界のシナリオは多様かつ複合的な劣化を伴うため、より豊かでより情報的なガイダンスで拡散モデルを提供する必要がある。
しかし、既存の手法では、既知の劣化重大性を仮定し、数値重大性をキャプチャできないCLIPテキストエンコーダに依存し、一般化能力を制限している。
そこで本研究では,低品質画像をセマンティック埋め込みと順序づけられた関係を捕捉し,未知のレベルをまたいだ補間を可能にする順序分解埋め込みに分解する<textbf{HD-CLIP} (\textbf{H}ierarchical \textbf{D}egradation CLIP)を提案する。
さらに,分類自由誘導法 (CFG) と分類自由投射誘導法 (CFPG) を用いて拡散モデルに統合した。
HD-CLIPは意味的手がかりを利用して、劣化手がかりを使用して生成的修復を誘導し、望ましくない幻覚や人工物を抑制する。
textbf{plug-and-play module} として、HD-CLIPはトレーニングなしで様々な超解像フレームワークにシームレスに統合することができ、様々な現実世界のデータセットの詳細な忠実さと知覚的リアリズムを大幅に改善することができる。
関連論文リスト
- Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Learning to Restore Multi-Degraded Images via Ingredient Decoupling and Task-Aware Path Adaptation [51.10017611491389]
現実のイメージは、雨、騒音、ヘイズのような複数の共存する劣化に悩まされることが多い。
本稿では, 劣化成分の分解表現を利用して, 画像の再構成を行う適応型多重劣化画像復元ネットワークを提案する。
その結果、IMDNetと呼ばれる密に統合されたアーキテクチャは、実験を通じて広範囲に検証されている。
論文 参考訳(メタデータ) (2025-11-07T01:50:36Z) - Unsupervised Image Super-Resolution Reconstruction Based on Real-World Degradation Patterns [4.977925450373957]
超解像再構成モデルのトレーニングのための新しいTripleGANフレームワークを提案する。
このフレームワークは、LR観測から実世界の劣化パターンを学習し、対応する劣化特性を持つデータセットを合成する。
本手法は, 過スムーズなアーティファクトを伴わずに, 鋭い復元を維持しながら, 定量的な測定値に明らかな利点を示す。
論文 参考訳(メタデータ) (2025-06-20T14:24:48Z) - Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.90908995927194]
画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。
我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。
このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文 参考訳(メタデータ) (2025-05-24T12:52:10Z) - ControlFusion: A Controllable Image Fusion Framework with Language-Vision Degradation Prompts [82.52042409680267]
現在の画像融合法は、現実の撮像シナリオで発生する複合劣化に対処するのに苦労している。
本稿では,制御フュージョンと呼ばれる言語ビジョンプロンプトを用いた制御可能な画像融合フレームワークを提案する。
実験では、制御フュージョンは、融合品質と劣化処理においてSOTA融合法より優れている。
論文 参考訳(メタデータ) (2025-03-30T08:18:53Z) - DaLPSR: Leverage Degradation-Aligned Language Prompt for Real-World Image Super-Resolution [19.33582308829547]
本稿では, 精度, 精細度, 高忠実度画像復元のために, 劣化対応言語プロンプトを活用することを提案する。
提案手法は,新しい最先端の知覚品質レベルを実現する。
論文 参考訳(メタデータ) (2024-06-24T09:30:36Z) - Suppressing Uncertainties in Degradation Estimation for Blind Super-Resolution [31.89605287039615]
ブラインド画像の超解像問題は、未知の劣化モードで低解像度(LR)画像から高解像度(HR)画像を復元することを目的としている。
既存のほとんどの手法は、ぼやけたカーネルを使って画像劣化過程をモデル化している。
盲目的のtextbf Super-textbfResolution フレームワークに対して,textbfUncertainty に基づく分解表現を提案する。
論文 参考訳(メタデータ) (2024-06-24T08:58:43Z) - DeeDSR: Towards Real-World Image Super-Resolution via Degradation-Aware Stable Diffusion [27.52552274944687]
低解像度画像のコンテンツや劣化を認識する拡散モデルの能力を高める新しい2段階の劣化認識フレームワークを提案する。
最初の段階では、教師なしのコントラスト学習を用いて画像劣化の表現を得る。
第2段階では、分解対応モジュールを単純化されたControlNetに統合し、様々な劣化への柔軟な適応を可能にします。
論文 参考訳(メタデータ) (2024-03-31T12:07:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。