論文の概要: DeepRFTv2: Kernel-level Learning for Image Deblurring
- arxiv url: http://arxiv.org/abs/2511.21132v1
- Date: Wed, 26 Nov 2025 07:30:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.010661
- Title: DeepRFTv2: Kernel-level Learning for Image Deblurring
- Title(参考訳): DeepRFTv2: 画像劣化のためのカーネルレベルの学習
- Authors: Xintian Mao, Haofei Song, Yin-Nian Liu, Qingli Li, Yan Wang,
- Abstract要約: ネットワークがデブロアを学ぼうとするなら、その曖昧なプロセスを理解するべきであることはよく知られている。
本稿では,フリエカーネル推定器(FKE)を提案する。
提案手法は,最先端の動作不良を解消し,他のカーネル関連問題に対処する可能性を示す。
- 参考スコア(独自算出の注目度): 21.144472443267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is well-known that if a network aims to learn how to deblur, it should understand the blur process. Blurring is naturally caused by the convolution of the sharp image with the blur kernel. Thus, allowing the network to learn the blur process in the kernel-level can significantly improve the image deblurring performance. But, current deep networks are still at the pixel-level learning stage, either performing end-to-end pixel-level restoration or stage-wise pseudo kernel-level restoration, failing to enable the deblur model to understand the essence of the blur. To this end, we propose Fourier Kernel Estimator (FKE), which considers the activation operation in Fourier space and converts the convolution problem in the spatial domain to a multiplication problem in Fourier space. Our FKE, jointly optimized with the deblur model, enables the network to learn the kernel-level blur process with low complexity and without any additional supervision. Furthermore, we change the convolution object of the kernel from ``image" to network extracted ``feature", whose rich semantic and structural information is more suitable to blur process learning. With the convolution of the feature and the estimated kernel, our model can learn the essence of blur in kernel-level. To further improve the efficiency of feature extraction, we design a decoupled multi-scale architecture with multiple hierarchical sub-unets with a reversible strategy, which allows better multi-scale encoding and decoding in low training memory. Extensive experiments indicate that our method achieves state-of-the-art motion deblurring results and show potential for handling other kernel-related problems. Analysis also shows our kernel estimator is able to learn physically meaningful kernels. The code will be available at https://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur.
- Abstract(参考訳): ネットワークがデブロアを学ぼうとするなら、その曖昧なプロセスを理解するべきであることはよく知られている。
ブラッシングは、シャープ画像とぼやけたカーネルとの畳み込みによって自然に発生する。
これにより、カーネルレベルでのぼやけた処理をネットワークで学べるようにすることで、画像劣化性能を大幅に向上させることができる。
しかし、現在のディープネットワークはまだピクセルレベルの学習段階にあり、エンド・ツー・エンドのピクセルレベルの復元や、ステージ単位の擬似カーネルレベルの復元を行うかのいずれかを行う。
この目的のために、フーリエ空間における活性化操作を考慮し、空間領域における畳み込み問題をフーリエ空間における乗算問題に変換するフーリエカーネル推定器(FKE)を提案する。
我々のFKEはデブロアモデルと共同で最適化されており、ネットワークは複雑さが低く、追加の監督なしにカーネルレベルのぼやけたプロセスを学ぶことができる。
さらに、カーネルの畳み込みオブジェクトを `image' から "feature" へ変更する。
この特徴と推定されたカーネルの畳み込みにより、我々のモデルはカーネルレベルの曖昧さの本質を学ぶことができる。
特徴抽出の効率をさらに高めるため,低トレーニングメモリにおけるマルチスケール符号化と復号化を向上する,可逆的な戦略で複数の階層的なサブユニットを持つデカップリング型マルチスケールアーキテクチャを設計する。
実験の結果,提案手法は最先端の動作不良を解消し,他のカーネル関連問題に対処できる可能性が示唆された。
分析により、我々のカーネル推定器は物理的に意味のあるカーネルを学習できることを示している。
コードはhttps://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur.comから入手できる。
関連論文リスト
- Blind Image Deblurring with FFT-ReLU Sparsity Prior [1.179778723980276]
ブラインドイメージデブロアリング(Blind image deblurring)は、ぼやけたカーネルに関する事前知識のないぼやけたイメージからシャープなイメージを復元するプロセスである。
画像の種類を多岐にわたって効果的に劣化させるために,ぼやけたカーネルを対象とする先行処理を利用する手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T15:51:39Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Learning with convolution and pooling operations in kernel methods [8.528384027684192]
近年の実証研究により、階層的畳み込みカーネルは、画像分類タスクにおけるカーネルメソッドの性能を向上させることが示されている。
畳み込みアーキテクチャにおける近似と一般化の正確な相互作用について検討する。
この結果から,対象関数に適応したアーキテクチャの選択が,サンプルの複雑性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2021-11-16T09:00:44Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - Explore Image Deblurring via Blur Kernel Space [17.67255729783263]
ブラインド画像の解読のための交互最適化アルゴリズムを提案する。
符号化された空間内のカーネルによって見えないぼかし演算子を近似し、対応するシャープイメージを検索する。
任意のデータセットから既存のぼかし演算子を新しいドメインに転送することで、ぼかし合成に使用できる。
論文 参考訳(メタデータ) (2021-04-01T07:52:53Z) - Blur Invariant Kernel-Adaptive Network for Single Image Blind deblurring [0.886014926770622]
本稿では,ぼやけたカーネルに関する情報を利用する,新しい,目が見えない,シングルイメージのデブロアリング手法を提案する。
まず、ぼやけた画像の分析に基づいて、適応的なぼやけたカーネルを生成するカーネル推定ネットワークを導入する。
本稿では,推定したぼやけたカーネルを用いて,シャープな画像を復元するデブロワーリングネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-09T03:53:33Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。