論文の概要: AdaQual-Diff: Diffusion-Based Image Restoration via Adaptive Quality Prompting
- arxiv url: http://arxiv.org/abs/2504.12605v1
- Date: Thu, 17 Apr 2025 03:08:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-25 23:15:06.960718
- Title: AdaQual-Diff: Diffusion-Based Image Restoration via Adaptive Quality Prompting
- Title(参考訳): AdaQual-Diff:Adaptive Quality Promptingによる拡散に基づく画像復元
- Authors: Xin Su, Chen Wu, Yu Zhang, Chen Lyu, Zhuoran Zheng,
- Abstract要約: 本稿では,知覚的品質評価を直接生成的回復プロセスに統合する拡散型フレームワークを提案する。
AdaQual-Diffは、さまざまな合成および実世界のデータセット間で視覚的に優れた復元を実現する。
- 参考スコア(独自算出の注目度): 10.175405673457892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Restoring images afflicted by complex real-world degradations remains challenging, as conventional methods often fail to adapt to the unique mixture and severity of artifacts present. This stems from a reliance on indirect cues which poorly capture the true perceptual quality deficit. To address this fundamental limitation, we introduce AdaQual-Diff, a diffusion-based framework that integrates perceptual quality assessment directly into the generative restoration process. Our approach establishes a mathematical relationship between regional quality scores from DeQAScore and optimal guidance complexity, implemented through an Adaptive Quality Prompting mechanism. This mechanism systematically modulates prompt structure according to measured degradation severity: regions with lower perceptual quality receive computationally intensive, structurally complex prompts with precise restoration directives, while higher quality regions receive minimal prompts focused on preservation rather than intervention. The technical core of our method lies in the dynamic allocation of computational resources proportional to degradation severity, creating a spatially-varying guidance field that directs the diffusion process with mathematical precision. By combining this quality-guided approach with content-specific conditioning, our framework achieves fine-grained control over regional restoration intensity without requiring additional parameters or inference iterations. Experimental results demonstrate that AdaQual-Diff achieves visually superior restorations across diverse synthetic and real-world datasets.
- Abstract(参考訳): 複雑な現実世界の劣化によって引き起こされる画像の復元は依然として困難であり、従来の方法では、遺物の特異な混合や重大さに適応できないことが多い。
これは、間接的な手がかりに頼り、真の知覚品質の欠陥をうまく捉えていないことに由来する。
この基本的限界に対処するために、私たちは、知覚的品質評価を直接生成的復元プロセスに統合する拡散ベースのフレームワークであるAdaQual-Diffを紹介します。
提案手法は,DeQAScoreから得られた地域品質スコアと適応品質プロンプティング機構によって実装された最適ガイダンス複雑性の数学的関係を確立する。
このメカニズムは、測定された劣化度に応じてプロンプト構造を体系的に調整する: 低い知覚品質の領域は計算的に集約的で構造的に複雑なプロンプトを受け取り、高い品質の領域は介入よりも保存に焦点を当てた最小限のプロンプトを受け取る。
本手法の技術的コアは,分解度に比例した計算資源の動的割当であり,空間的に変化する誘導場を生成し,拡散過程を数学的精度で指示する。
この品質誘導型アプローチとコンテンツ固有の条件付けを組み合わせることで、追加パラメータや推論の繰り返しを必要とせずに、局所的な復元強度のきめ細かい制御を実現する。
実験の結果、AdaQual-Diffは様々な合成および実世界のデータセットで視覚的に優れた復元を実現することが示された。
関連論文リスト
- InvFussion: Bridging Supervised and Zero-shot Diffusion for Inverse Problems [76.39776789410088]
この研究は、教師付きアプローチの強いパフォーマンスとゼロショットメソッドの柔軟性を組み合わせたフレームワークを導入している。
新規なアーキテクチャ設計では、分解演算子を直接デノイザにシームレスに統合する。
FFHQとImageNetデータセットの実験結果は、最先端の後方サンプリング性能を示している。
論文 参考訳(メタデータ) (2025-04-02T12:40:57Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文 参考訳(メタデータ) (2025-03-12T11:39:51Z) - InterLCM: Low-Quality Images as Intermediate States of Latent Consistency Models for Effective Blind Face Restoration [106.70903819362402]
拡散前駆体は、低画質画像の復元のために、復元データセットの微細調整拡散モデル(DM)によってブラインドフェイス復元(BFR)に使用されている。
我々は,その優れたセマンティック一貫性と効率のために潜在一貫性モデル(LCM)を活用するために,InterLCMを提案する。
InterLCMは、合成データセットと実世界のデータセットの両方において既存のアプローチより優れており、推論速度も高速である。
論文 参考訳(メタデータ) (2025-02-04T10:51:20Z) - Diff-Restorer: Unleashing Visual Prompts for Diffusion-based Universal Image Restoration [19.87693298262894]
拡散モデルに基づく普遍的な画像復元手法であるDiff-Restorerを提案する。
我々は、事前学習された視覚言語モデルを用いて、劣化した画像から視覚的プロンプトを抽出する。
また、デグレーション対応デコーダを設計し、構造的補正を行い、潜在コードをピクセル領域に変換する。
論文 参考訳(メタデータ) (2024-07-04T05:01:10Z) - SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration [20.873676111265656]
SSP-IRは、低画質の画像からセマンティックと構造をフル活用することを目的としている。
提案手法は,合成および実世界のデータセットにおいて,他の最先端手法よりも優れる。
論文 参考訳(メタデータ) (2024-07-04T04:55:14Z) - Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.84134880709625]
拡散モデルを用いて,雑音空間を介して領域適応を行うことが可能であることを示す。
特に、補助的な条件入力が多段階の復調過程にどのように影響するかというユニークな性質を活用することにより、有意義な拡散損失を導出する。
拡散モデルにおけるチャネルシャッフル層や残留スワッピング型コントラスト学習などの重要な戦略を提案する。
論文 参考訳(メタデータ) (2024-06-26T17:40:30Z) - DPER: Diffusion Prior Driven Neural Representation for Limited Angle and Sparse View CT Reconstruction [45.00528216648563]
Diffusion Prior Driven Neural Representation (DPER) は、異常に不適切なCT再構成逆問題に対処するために設計された、教師なしのフレームワークである。
DPERは、半二次分割法(HQS)アルゴリズムを採用し、逆問題からデータ忠実度とサブプロブレム前の分布に分解する。
LACTにおけるDPERの性能評価と2つの公開データセットを用いた超SVCT再構成に関する総合的な実験を行った。
論文 参考訳(メタデータ) (2024-04-27T12:55:13Z) - Adapt and Diffuse: Sample-adaptive Reconstruction via Latent Diffusion Models [24.5360032541275]
逆問題は、ノイズや(非線形でない)観測からクリーンな信号を回復することが目的である複数のアプリケーションで発生する。
我々のキーとなる観察は、既存の逆問題解決器のほとんどは、再構成作業の難易度に計算力を適応させる能力が欠如していることである。
オートエンコーダの潜時空間における劣化信号の劣化度を推定するために,$textitseverity encoding$という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-12T23:41:29Z) - DiracDiffusion: Denoising and Incremental Reconstruction with Assured Data-Consistency [24.5360032541275]
拡散モデルは、画像復元を含む多数のコンピュータビジョンタスクにおいて、この技術の新たな状態を確立した。
逆問題解決のための新しい枠組みを提案する。つまり、観測は徐々に劣化し、元のクリーンイメージにノイズを与える劣化過程から来ていると仮定する。
本手法は, 逆過程を通じて元の計測値との整合性を維持し, 歪み指標の改善と早期ストッピングによるサンプリング高速化のために, 知覚品質のトレードオフに優れた柔軟性を実現する。
論文 参考訳(メタデータ) (2023-03-25T04:37:20Z) - Editing Out-of-domain GAN Inversion via Differential Activations [56.62964029959131]
本稿では,構成分解パラダイムを用いて,ドメイン外反転問題に対処する新しいGAN事前編集フレームワークを提案する。
生成されたDiff-CAMマスクの助けを借りて、粗い再構成を直感的に元の画像と編集された画像で合成することができる。
また, 分解段階において, 粗い再構成から最終微編集画像を切り離すための, GAN 以前のデゴーストネットワークを提示する。
論文 参考訳(メタデータ) (2022-07-17T10:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。