論文の概要: QUSR: Quality-Aware and Uncertainty-Guided Image Super-Resolution Diffusion Model
- arxiv url: http://arxiv.org/abs/2603.09125v1
- Date: Tue, 10 Mar 2026 02:57:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.968534
- Title: QUSR: Quality-Aware and Uncertainty-Guided Image Super-Resolution Diffusion Model
- Title(参考訳): QUSR:品質認識と不確実性誘導画像超解像拡散モデル
- Authors: Junjie Yin, Jiaju Li, Hanfa Xing,
- Abstract要約: 拡散に基づく画像超解像(ISR)は強い可能性を示しているが、劣化が未知で空間的に一様でない実世界のシナリオでは依然として苦戦している。
本稿では,QAP(Quality-Aware Prior)とUNG(Uncertainty-Guided Noise Generation)モジュールを統合した新しい超解像拡散モデルQUSRを提案する。
実験結果から,QUSRは実世界のシナリオにおいて高忠実かつ高現実的なイメージを生成可能であることが確認された。
- 参考スコア(独自算出の注目度): 0.8860478071045285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based image super-resolution (ISR) has shown strong potential, but it still struggles in real-world scenarios where degradations are unknown and spatially non-uniform, often resulting in lost details or visual artifacts. To address this challenge, we propose a novel super-resolution diffusion model, QUSR, which integrates a Quality-Aware Prior (QAP) with an Uncertainty-Guided Noise Generation (UNG) module. The UNG module adaptively adjusts the noise injection intensity, applying stronger perturbations to high-uncertainty regions (e.g., edges and textures) to reconstruct complex details, while minimizing noise in low-uncertainty regions (e.g., flat areas) to preserve original information. Concurrently, the QAP leverages an advanced Multimodal Large Language Model (MLLM) to generate reliable quality descriptions, providing an effective and interpretable quality prior for the restoration process. Experimental results confirm that QUSR can produce high-fidelity and high-realism images in real-world scenarios. The source code is available at https://github.com/oTvTog/QUSR.
- Abstract(参考訳): 拡散に基づく画像超解像(ISR)は強い可能性を示しているが、劣化が未知で空間的に一様でない現実のシナリオでは依然として苦戦しており、しばしば詳細や視覚的アーティファクトが失われる。
そこで本研究では,QAP(Quality-Aware Prior)とUNG(Uncertainty-Guided Noise Generation)モジュールを統合した新しい超解像拡散モデルQUSRを提案する。
UNGモジュールは、ノイズ注入強度を適応的に調整し、高不確実領域(例えば、エッジやテクスチャ)に強い摂動を適用して複雑な詳細を再構築すると共に、低不確実領域(例えば、平坦領域)のノイズを最小限に抑えて元の情報を保存する。
同時に、QAPは高度なマルチモーダル大言語モデル(MLLM)を活用して信頼性の高い品質記述を生成し、回復プロセスに先立って有効かつ解釈可能な品質を提供する。
実験結果から,QUSRは実世界のシナリオにおいて高忠実かつ高現実的なイメージを生成可能であることが確認された。
ソースコードはhttps://github.com/oTvTog/QUSR.comで入手できる。
関連論文リスト
- One-Step Diffusion Transformer for Controllable Real-World Image Super-Resolution [54.485573602613535]
本稿では,一段階拡散変換器であるODTSRについて述べる。
ODTSRは、制御性を高め、一段階の推論を達成するために、Fidelity-aware Adversarial Training (FAA)を採用している。
実験により,ODTSRは汎用Real-ISR上でのSOTA(State-of-the-art)性能を実現することが示された。
論文 参考訳(メタデータ) (2025-11-21T11:00:59Z) - Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution [7.986370916847687]
本稿では、第4次ウェーブレット前処理フレームワークと遅延拡散モデルを統合する新しいSRフレームワークResQuを紹介する。
提案手法は,四元系ウェーブレットの埋め込みを利用して,様々な段階で動的に統合される条件付けプロセスを強化する。
提案手法は,多くの場合において,知覚品質および標準評価指標における既存手法よりも優れる,優れたSR結果が得られる。
論文 参考訳(メタデータ) (2025-05-01T06:17:33Z) - BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution [19.568467335629094]
ベイジアン不確実性誘導拡散確率モデル(BUFF)を紹介する。
BUFFは、ハイレゾな不確実性マスクを生成するためにベイズネットワークを組み込むことで、自分自身を区別する。
複雑なテクスチャと細部が特徴の領域において、人工物やぼやけを著しく軽減する。
論文 参考訳(メタデータ) (2025-04-04T14:43:45Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - Unsupervised Single Image Super-resolution Under Complex Noise [60.566471567837574]
本稿では,一般のSISRタスクを未知の劣化で扱うためのモデルベースunsupervised SISR法を提案する。
提案手法は, より小さなモデル (0.34M vs. 2.40M) だけでなく, より高速な技術 (SotA) 法 (約1dB PSNR) の現況を明らかに超えることができる。
論文 参考訳(メタデータ) (2021-07-02T11:55:40Z) - Noise Conditional Flow Model for Learning the Super-Resolution Space [8.130080378039601]
超解法におけるノイズ条件流モデルNCSRは、画像の視覚的品質と多様性を高める。
NCSRは,従来のGANモデルよりも,多様性と視覚的品質が向上し,視覚的品質が向上することを示す。
論文 参考訳(メタデータ) (2021-06-06T07:43:52Z) - Kernel Adversarial Learning for Real-world Image Super-resolution [23.904933824966605]
本稿では,Kernel Adversarial Learning Super- resolutionフレームワークを導入することで,現実のイメージSRのための低解像度画像をよりリアルに合成するプロセスを提案する。
提案フレームワークでは、劣化カーネルとノイズを明示的に指定するのではなく適応的にモデル化する。
また、モデルSR再構成精度をさらに高めるために、高周波選択的目的と反復的監視プロセスを提案する。
論文 参考訳(メタデータ) (2021-04-19T01:51:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。