論文の概要: HDW-SR: High-Frequency Guided Diffusion Model based on Wavelet Decomposition for Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2511.13175v1
- Date: Mon, 17 Nov 2025 09:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.100439
- Title: HDW-SR: High-Frequency Guided Diffusion Model based on Wavelet Decomposition for Image Super-Resolution
- Title(参考訳): HDW-SR:超解像のためのウェーブレット分解に基づく高周波誘導拡散モデル
- Authors: Chao Yang, Boqian Zhang, Jinghao Xu, Guang Jiang,
- Abstract要約: ウェーブレット分解(HDW-SR)に基づく高周波誘導拡散ネットワークを提案する。
我々は残差マップのみに拡散を行い、ネットワークがより効率的に高周波情報復元に集中できるようにする。
合成データセットと実世界のデータセットの両方の実験は、HDW-SRが競合する超解像性能を達成することを示した。
- 参考スコア(独自算出の注目度): 4.388490927225987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based methods have shown great promise in single image super-resolution (SISR); however, existing approaches often produce blurred fine details due to insufficient guidance in the high-frequency domain. To address this issue, we propose a High-Frequency Guided Diffusion Network based on Wavelet Decomposition (HDW-SR), which replaces the conventional U-Net backbone in diffusion frameworks. Specifically, we perform diffusion only on the residual map, allowing the network to focus more effectively on high-frequency information restoration. We then introduce wavelet-based downsampling in place of standard CNN downsampling to achieve multi-scale frequency decomposition, enabling sparse cross-attention between the high-frequency subbands of the pre-super-resolved image and the low-frequency subbands of the diffused image for explicit high-frequency guidance. Moreover, a Dynamic Thresholding Block (DTB) is designed to refine high-frequency selection during the sparse attention process. During upsampling, the invertibility of the wavelet transform ensures low-loss feature reconstruction. Experiments on both synthetic and real-world datasets demonstrate that HDW-SR achieves competitive super-resolution performance, excelling particularly in recovering fine-grained image details. The code will be available after acceptance.
- Abstract(参考訳): 拡散法に基づく手法は、単一画像超解像(SISR)において非常に有望であるが、既存の手法では高周波領域でのガイダンスが不十分なため、しばしばぼやけた細部を生じさせる。
本稿では、従来の拡散フレームワークのU-Netバックボーンを置き換える、ウェーブレット分解(HDW-SR)に基づく高周波誘導拡散ネットワークを提案する。
具体的には、残差マップのみに拡散を行い、ネットワークがより効率的に高周波情報復元に集中できるようにする。
次に、標準的なCNNダウンサンプリングの代わりにウェーブレットに基づくダウンサンプリングを導入し、マルチスケールの周波数分解を実現し、前上解像の高周波サブバンドと拡散像の低周波サブバンドとの疎交差を可能とし、高周波誘導を明示する。
さらに、スパークアテンションプロセス中に高周波選択を洗練させるために、動的閾値ブロック(DTB)を設計する。
アップサンプリング中、ウェーブレット変換の可逆性は低損失特徴再構成を保証する。
合成データセットと実世界のデータセットの両方の実験では、HDW-SRは競合する超解像性能を達成し、特に微細な画像の詳細の復元に優れていた。
コードは受理後利用可能になる。
関連論文リスト
- Diffusion Transformer meets Multi-level Wavelet Spectrum for Single Image Super-Resolution [15.056888813012451]
SR(DTWSR)のための画像ウェーブレットスペクトルに基づく拡散変換器モデルを提案する。
DTWSRは拡散モデルと変圧器の優位性を取り入れ、マルチスケール周波数サブバンド間の相互関係を捉える。
デュアルデコーダは、画像生成におけるアライメントを省略することなく、低周波サブバンドと高周波サブバンドの異なるばらつきを扱うよう精巧に設計されている。
論文 参考訳(メタデータ) (2025-11-03T02:56:58Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Local Implicit Wavelet Transformer for Arbitrary-Scale Super-Resolution [15.610136214020947]
暗黙の神経表現は、最近、画像の任意のスケールの超解像(SR)において有望な可能性を証明している。
既存のほとんどの手法は、クエリされた座標と近くの特徴のアンサンブルに基づいて、SR画像中のピクセルを予測する。
本稿では,高周波テクスチャの再現性を高めるために,LIWT(Local Implicit Wavelet Transformer)を提案する。
論文 参考訳(メタデータ) (2024-11-10T12:21:14Z) - Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution [19.327571569959062]
周波数領域誘導型マルチスケール拡散モデル(FDDiff)を提案する。
FDDiffは、高周波情報補完プロセスをよりきめ細かいステップに分解する。
これは、高忠実度超解像結果で先行生成法より優れる。
論文 参考訳(メタデータ) (2024-05-16T11:58:52Z) - WaveNeRF: Wavelet-based Generalizable Neural Radiance Fields [149.2296890464997]
我々は、ウェーブレット周波数分解をMVSとNeRFに統合したWaveNeRFを設計する。
WaveNeRFは、3つの画像のみを入力として与えたときに、より優れた一般化可能な放射場モデリングを実現する。
論文 参考訳(メタデータ) (2023-08-09T09:24:56Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。