論文の概要: KernelFusion: Assumption-Free Blind Super-Resolution via Patch Diffusion
- arxiv url: http://arxiv.org/abs/2503.21907v1
- Date: Thu, 27 Mar 2025 18:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:29:52.513762
- Title: KernelFusion: Assumption-Free Blind Super-Resolution via Patch Diffusion
- Title(参考訳): KernelFusion: Patch Diffusionによる無仮定ブラインド超解法
- Authors: Oliver Heinimann, Assaf Shocher, Tal Zimbalist, Michal Irani,
- Abstract要約: カーネルを仮定しないゼロショット拡散法を提案する。
まず、単一のLR入力画像上に、画像固有のパッチベースの拡散モデルをトレーニングし、その内部パッチの独自の統計値を取得する。
次に、同じ学習パッチ分布でより大きなHRイメージを再構成し、同時に正しいダウンスケーリングSR-カーネルを復元する。
- 参考スコア(独自算出の注目度): 13.468846462250168
- License:
- Abstract: Traditional super-resolution (SR) methods assume an ``ideal'' downscaling SR-kernel (e.g., bicubic downscaling) between the high-resolution (HR) image and the low-resolution (LR) image. Such methods fail once the LR images are generated differently. Current blind-SR methods aim to remove this assumption, but are still fundamentally restricted to rather simplistic downscaling SR-kernels (e.g., anisotropic Gaussian kernels), and fail on more complex (out of distribution) downscaling degradations. However, using the correct SR-kernel is often more important than using a sophisticated SR algorithm. In ``KernelFusion'' we introduce a zero-shot diffusion-based method that makes no assumptions about the kernel. Our method recovers the unique image-specific SR-kernel directly from the LR input image, while simultaneously recovering its corresponding HR image. KernelFusion exploits the principle that the correct SR-kernel is the one that maximizes patch similarity across different scales of the LR image. We first train an image-specific patch-based diffusion model on the single LR input image, capturing its unique internal patch statistics. We then reconstruct a larger HR image with the same learned patch distribution, while simultaneously recovering the correct downscaling SR-kernel that maintains this cross-scale relation between the HR and LR images. Empirical results show that KernelFusion vastly outperforms all SR baselines on complex downscaling degradations, where existing SotA Blind-SR methods fail miserably. By breaking free from predefined kernel assumptions, KernelFusion pushes Blind-SR into a new assumption-free paradigm, handling downscaling kernels previously thought impossible.
- Abstract(参考訳): 従来の超解像 (SR) 法では、高分解能 (HR) 画像と低分解能 (LR) 画像の間の ''ideal' ダウンスケーリング SR-カーネル (例:バイコビックダウンスケーリング) を仮定している。
このような方法はLR画像が異なる方法で生成されるとフェールする。
現在の盲点SR法は、この仮定を除去することを目的としているが、基本的にはSRカーネル(例えば、異方性ガウス核)の単純化的なダウンスケーリングに制限されており、より複雑な(分布外)ダウンスケーリング分解では失敗する。
しかし、正しいSRカーネルを使用する場合、洗練されたSRアルゴリズムを使用する場合よりも、しばしば重要である。
KernelFusion'では、カーネルに関する仮定をしないゼロショット拡散ベースのメソッドを導入します。
本手法は,LR入力画像から直接独自のSRカーネルを復元し,同時に対応するHR画像を復元する。
KernelFusionは、正しいSRカーネルはLR画像の異なるスケールにわたるパッチ類似性を最大化するものであるという原理を利用する。
まず、単一のLR入力画像上に、画像固有のパッチベースの拡散モデルをトレーニングし、その内部パッチの独自の統計値を取得する。
次に,このHR画像とLR画像のクロススケールな関係を保ちながら,同一の学習パッチ分布でより大きなHR画像を再構成し,正しいダウンスケーリングSRカーネルを復元する。
経験的な結果から、KernelFusionは、既存のSotA Blind-SR法が誤って失敗する複雑なダウンスケーリング劣化に対して、すべてのSRベースラインを大幅に上回ることを示した。
KernelFusionは、事前に定義されたカーネルの仮定から解放することで、Blind-SRを新しい仮定のないパラダイムに推し進める。
関連論文リスト
- Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images [7.920423405957888]
E$2$DiffSRは、最先端のSR手法と比較して、客観的な指標と視覚的品質を達成する。
拡散に基づくSR法の推論時間を非拡散法と同程度のレベルに短縮する。
論文 参考訳(メタデータ) (2024-10-30T09:14:13Z) - Burst Super-Resolution with Diffusion Models for Improving Perceptual Quality [12.687175237915019]
バーストLR画像を受け入れる以前のSRネットワークは、曖昧なSR画像を生成することが知られている決定論的方法で訓練される。
このようなぼやけた画像は知覚的に劣化しているので、我々は鋭い高忠実度境界を再構築することを目指している。
一方,提案手法では,初期バーストSR画像の再構成にバーストLR特性を用いる。
論文 参考訳(メタデータ) (2024-03-28T13:58:05Z) - BlindDiff: Empowering Degradation Modelling in Diffusion Models for Blind Image Super-Resolution [52.47005445345593]
BlindDiff は SISR のブラインド劣化に対処するための DM ベースのブラインドSR 手法である。
BlindDiffはMAPベースの最適化をDMにシームレスに統合する。
合成データセットと実世界のデータセットの両方の実験は、BlindDiffが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2024-03-15T11:21:34Z) - Kernelized Back-Projection Networks for Blind Super Resolution [14.422263486129811]
超分解能(SR)は、任意の劣化によって劣化した低分解能(LR)画像の超分解に失敗する。
本稿では, ブラインドSRの劣化モデルに比較して, ブラインドカーネルを用いて訓練した非ブラインドSRは, ブラインドSRの劣化モデルと同等の性能を示すことを示す。
論文 参考訳(メタデータ) (2023-02-16T18:35:39Z) - Kernel-aware Raw Burst Blind Super-Resolution [0.0]
バースト超解像(SR)は、低画質の画像からリッチな詳細を復元する可能性を提供する。
既存の非盲点ネットワークは、高解像度(HR)画像の復元において、パフォーマンスが著しく低下する。
本稿では,カーネル対応の変形可能なアライメントモジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T11:49:13Z) - Spectrum-to-Kernel Translation for Accurate Blind Image Super-Resolution [33.59749785182318]
任意のぼかしカーネルで劣化したLR画像の超解像化のための新しいブラインドSRフレームワークを提案する。
まず、周波数領域における特徴表現は、空間領域よりもカーネル再構成を曖昧にするため、より導出的であることを示す。
合成画像と実画像の両方で実験した結果,提案手法はカーネル推定誤差を十分に低減することがわかった。
論文 参考訳(メタデータ) (2021-10-23T06:03:22Z) - Mutual Affine Network for Spatially Variant Kernel Estimation in Blind
Image Super-Resolution [130.32026819172256]
既存のブラインド画像超解像法(SR)は、ぼやけたカーネルが画像全体にわたって空間的に不変であると仮定する。
本稿では,空間変動カーネル推定のための相互アフィンネットワーク(MANet)を提案する。
論文 参考訳(メタデータ) (2021-08-11T16:11:17Z) - End-to-end Alternating Optimization for Blind Super Resolution [68.395664154041]
2段階の解決策は、2つの独立に訓練されたモデルを含む。
我々は、ボケカーネルを推定し、単一のモデルでSRイメージを復元することができる交互最適化アルゴリズムを採用しています。
我々のモデルは最先端の手法を大きく上回り、はるかに高速で視覚的に有利な結果が得られる。
論文 参考訳(メタデータ) (2021-05-14T15:05:30Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Unfolding the Alternating Optimization for Blind Super Resolution [60.39409203244474]
2段階の解決策は、2つの独立に訓練されたモデルを含む。
ボケカーネルを推定し,SR画像を1つのモデルで復元できる交互最適化アルゴリズムを採用する。
我々のモデルは最先端の手法を大きく上回り、はるかに高速で視覚的に有利な結果が得られる。
論文 参考訳(メタデータ) (2020-10-06T11:27:27Z) - Cross-Scale Internal Graph Neural Network for Image Super-Resolution [147.77050877373674]
自然画像における非局所的な自己相似性は、画像修復に有効な先行研究として、よく研究されている。
単一の画像超解像(SISR)の場合、既存のディープ非局所法のほとんどは、低解像度(LR)入力画像と同じ規模のパッチしか利用していない。
これは、新しいクロススケールな内部グラフニューラルネットワーク(IGNN)を用いて実現される。
論文 参考訳(メタデータ) (2020-06-30T10:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。