論文の概要: Single Image Super-Resolution via Bivariate `A Trous Wavelet Diffusion
- arxiv url: http://arxiv.org/abs/2603.07234v2
- Date: Sun, 15 Mar 2026 19:08:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 13:51:28.996669
- Title: Single Image Super-Resolution via Bivariate `A Trous Wavelet Diffusion
- Title(参考訳): Bivariate ‘A Trous Wavelet Diffusion’による単一画像超解像
- Authors: Maryam Heidari, Nantheera Anantrasirichai, Alin Achim,
- Abstract要約: 超解像(SR)モデルは、人工物を導入することなく高周波構造を復元できる必要がある。
生成過程において,構造化されたクロススケールガイダンスを提供するBATDiffを紹介する。
既存の拡散ベースラインや非拡散ベースラインよりも鋭く、構造的に一貫した再構築をもたらす。
- 参考スコア(独自算出の注目度): 5.897882149801945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The effectiveness of super resolution (SR) models hinges on their ability to recover high frequency structure without introducing artifacts. Diffusion based approaches have recently advanced the state of the art in SR. However, most diffusion based SR pipelines operate purely in the spatial domain, which may yield high frequency details that are not well supported by the underlying low resolution evidence. On the other hand, unlike supervised SR models that may inject dataset specific textures, single image SR relies primarily on internal image statistics and can therefore be less prone to dataset-driven hallucinations; nevertheless, ambiguity in the LR observation can still lead to inconsistent high frequency details. To tackle this problem, we introduce BATDiff, an unsupervised Bivariate A trous Wavelet Diffusion model designed to provide structured cross scale guidance during the generative process. BATDiff employs an a Trous wavelet transform that constructs an undecimated multiscale representation in which high frequency components are progressively revealed while the full spatial resolution is preserved. As the core inference mechanism, BATDiff includes a bivariate cross scale module that models parent child dependencies between adjacent scales. It improves high frequency coherence and reduces mismatch artifacts in diffusion based SR. Experiments on standard benchmarks demonstrate that BATDiff produces sharper and more structurally consistent reconstructions than existing diffusion and non diffusion baselines, achieving improvements in fidelity and perceptual quality.
- Abstract(参考訳): 超分解能モデル(SR)の有効性は、人工物を導入することなく高周波構造を復元する能力に左右される。
拡散に基づくアプローチは、最近、SRにおける最先端のアプローチを進歩させた。
しかし、拡散に基づくほとんどのSRパイプラインは純粋に空間領域で動作しており、基礎となる低分解能証拠にあまり支持されない高周波の詳細をもたらす可能性がある。
一方、データセット固有のテクスチャを注入できる教師付きSRモデルとは異なり、単一画像SRは内部画像統計に大きく依存しているため、データセット駆動の幻覚の傾向が低い。
この問題を解決するために,BATDiffを導入する。これは,生成過程において,構造化されたクロススケールガイダンスを提供するために設計された,教師なしバイバリケートAトロスウェーブレット拡散モデルである。
BATDiffは、完全な空間分解能を維持しながら、高周波成分が徐々に明らかにされる非効率なマルチスケール表現を構成する、Trousウェーブレット変換を採用している。
コア推論メカニズムとして、BATDiffには、2変数のクロススケールモジュールが含まれている。
高周波コヒーレンスを改善し、拡散ベースSRにおけるミスマッチアーティファクトを低減する。
標準ベンチマークの実験では、BATDiffは既存の拡散や非拡散ベースラインよりもシャープで構造的に一貫した再構築を実現し、忠実さと知覚品質の向上を実現している。
関連論文リスト
- HDW-SR: High-Frequency Guided Diffusion Model based on Wavelet Decomposition for Image Super-Resolution [4.388490927225987]
ウェーブレット分解(HDW-SR)に基づく高周波誘導拡散ネットワークを提案する。
我々は残差マップのみに拡散を行い、ネットワークがより効率的に高周波情報復元に集中できるようにする。
合成データセットと実世界のデータセットの両方の実験は、HDW-SRが競合する超解像性能を達成することを示した。
論文 参考訳(メタデータ) (2025-11-17T09:25:26Z) - Diffusion Transformer meets Multi-level Wavelet Spectrum for Single Image Super-Resolution [15.056888813012451]
SR(DTWSR)のための画像ウェーブレットスペクトルに基づく拡散変換器モデルを提案する。
DTWSRは拡散モデルと変圧器の優位性を取り入れ、マルチスケール周波数サブバンド間の相互関係を捉える。
デュアルデコーダは、画像生成におけるアライメントを省略することなく、低周波サブバンドと高周波サブバンドの異なるばらつきを扱うよう精巧に設計されている。
論文 参考訳(メタデータ) (2025-11-03T02:56:58Z) - Knowledge-guided Complex Diffusion Model for PolSAR Image Classification in Contourlet Domain [58.46450049579116]
本稿では,Contourlet領域におけるPolSAR画像分類のための知識誘導複合拡散モデルを提案する。
具体的には、まずデータを低周波サブバンドと高周波サブバンドに分解するためにContourlet変換を適用する。
次に、低周波成分の統計特性をモデル化するために、知識誘導複合拡散ネットワークを設計する。
論文 参考訳(メタデータ) (2025-07-08T04:50:28Z) - One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。
VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。
提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文 参考訳(メタデータ) (2025-06-03T08:28:13Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - DeltaDiff: Reality-Driven Diffusion with AnchorResiduals for Faithful SR [10.790771977682763]
拡散過程を制約する新しいフレーム・ワークであるDeltaDiffを提案する。
提案手法は最先端のモデルを超え,忠実度を向上した再侮辱を生成する。
この研究は、画像再構成タスクに拡散モデルを適用するための、新しい低ランク制約パラパラダイムを確立する。
論文 参考訳(メタデータ) (2025-02-18T06:07:14Z) - Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images [7.920423405957888]
E$2$DiffSRは、最先端のSR手法と比較して、客観的な指標と視覚的品質を達成する。
拡散に基づくSR法の推論時間を非拡散法と同程度のレベルに短縮する。
論文 参考訳(メタデータ) (2024-10-30T09:14:13Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。