論文の概要: Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2505.00334v1
- Date: Thu, 01 May 2025 06:17:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.243371
- Title: Quaternion Wavelet-Conditioned Diffusion Models for Image Super-Resolution
- Title(参考訳): 画像超解像のための第四次ウェーブレット共振拡散モデル
- Authors: Luigi Sigillo, Christian Bianchi, Danilo Comminiello,
- Abstract要約: 本稿では、第4次ウェーブレット前処理フレームワークと遅延拡散モデルを統合する新しいSRフレームワークResQuを紹介する。
提案手法は,四元系ウェーブレットの埋め込みを利用して,様々な段階で動的に統合される条件付けプロセスを強化する。
提案手法は,多くの場合において,知覚品質および標準評価指標における既存手法よりも優れる,優れたSR結果が得られる。
- 参考スコア(独自算出の注目度): 4.307648859471193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image Super-Resolution is a fundamental problem in computer vision with broad applications spacing from medical imaging to satellite analysis. The ability to reconstruct high-resolution images from low-resolution inputs is crucial for enhancing downstream tasks such as object detection and segmentation. While deep learning has significantly advanced SR, achieving high-quality reconstructions with fine-grained details and realistic textures remains challenging, particularly at high upscaling factors. Recent approaches leveraging diffusion models have demonstrated promising results, yet they often struggle to balance perceptual quality with structural fidelity. In this work, we introduce ResQu a novel SR framework that integrates a quaternion wavelet preprocessing framework with latent diffusion models, incorporating a new quaternion wavelet- and time-aware encoder. Unlike prior methods that simply apply wavelet transforms within diffusion models, our approach enhances the conditioning process by exploiting quaternion wavelet embeddings, which are dynamically integrated at different stages of denoising. Furthermore, we also leverage the generative priors of foundation models such as Stable Diffusion. Extensive experiments on domain-specific datasets demonstrate that our method achieves outstanding SR results, outperforming in many cases existing approaches in perceptual quality and standard evaluation metrics. The code will be available after the revision process.
- Abstract(参考訳): Image Super-Resolutionは、医療画像から衛星分析まで幅広い用途でコンピュータビジョンの基本的な問題である。
低解像度入力から高解像度画像を再構成する能力は、オブジェクト検出やセグメンテーションといった下流タスクの強化に不可欠である。
ディープラーニングはSRを大きく進歩させたが、細かな細部と現実的なテクスチャで高品質な再構築を実現することは、特に高いスケールアップ要因において困難である。
拡散モデルを利用した最近のアプローチは有望な結果を示しているが、しばしば知覚品質と構造的忠実さのバランスをとるのに苦労している。
本研究では,第4次ウェーブレット前処理フレームワークと遅延拡散モデルを統合した新しいSRフレームワークResQuを紹介する。
拡散モデルにウェーブレット変換を単純に適用する従来の方法とは異なり、我々は第四次ウェーブレット埋め込みを利用して条件付けプロセスを強化する。
さらに、安定拡散のような基礎モデルの生成的先行性も活用する。
ドメイン固有のデータセットに対する大規模な実験により,本手法は優れたSR結果が得られることが示され,多くの場合において,知覚的品質と標準評価指標における既存のアプローチよりも優れていた。
コードはリビジョンプロセス後に利用可能になる。
関連論文リスト
- SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - Spatial-and-Frequency-aware Restoration method for Images based on
Diffusion Models [7.947387272047602]
画像復元のための空間・周波数対応拡散モデルSaFaRIを提案する。
本モデルでは,空間領域と周波数領域の両領域において画像の忠実度を保ち,再現性の向上を図っている。
我々の徹底的な評価は、SaFaRIがImageNetデータセットとFFHQデータセットの両方で最先端のパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2024-01-31T07:11:01Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising [16.43285056788183]
再構成・生成拡散モデル(Reconstruct-and-Generate Diffusion Model, RnG)と呼ばれる新しい手法を提案する。
提案手法は, 再構成型復調ネットワークを利用して, 基礎となるクリーン信号の大半を復元する。
拡散アルゴリズムを用いて残留する高周波の詳細を生成し、視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-09-19T16:01:20Z) - Stage-by-stage Wavelet Optimization Refinement Diffusion Model for
Sparse-View CT Reconstruction [14.037398189132468]
本稿では,Sparse-view CT再構成のためのSWORD(Stage-by-stage Optimization Refinement Diffusion)モデルを提案する。
具体的には、低周波および高周波生成モデルを統合する統一的な数学的モデルを構築し、最適化手順で解を実現する。
提案手法は,低周波発生,高周波高精細化,領域変換の3段階を含む,確立された最適化理論に根ざした。
論文 参考訳(メタデータ) (2023-08-30T10:48:53Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - XCycles Backprojection Acoustic Super-Resolution [4.022090911982323]
本研究では,音響画像の超解像問題に対する新しいバックプロジェクションモデルアーキテクチャを提案する。
低分解能空間と高分解能空間の両方で符号化された特徴の残差誤差補正を再現するために、各サイクルにおける反復補正手順を使用する。
また、データ取得時に発生するサブサンプリングエラーを大幅に削減した。
論文 参考訳(メタデータ) (2021-05-19T13:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。