論文の概要: DeepRFTv2: Kernel-level Learning for Image Deblurring
- arxiv url: http://arxiv.org/abs/2511.21132v1
- Date: Wed, 26 Nov 2025 07:30:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.010661
- Title: DeepRFTv2: Kernel-level Learning for Image Deblurring
- Title(参考訳): DeepRFTv2: 画像劣化のためのカーネルレベルの学習
- Authors: Xintian Mao, Haofei Song, Yin-Nian Liu, Qingli Li, Yan Wang,
- Abstract要約: ネットワークがデブロアを学ぼうとするなら、その曖昧なプロセスを理解するべきであることはよく知られている。
本稿では,フリエカーネル推定器(FKE)を提案する。
提案手法は,最先端の動作不良を解消し,他のカーネル関連問題に対処する可能性を示す。
- 参考スコア(独自算出の注目度): 21.144472443267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is well-known that if a network aims to learn how to deblur, it should understand the blur process. Blurring is naturally caused by the convolution of the sharp image with the blur kernel. Thus, allowing the network to learn the blur process in the kernel-level can significantly improve the image deblurring performance. But, current deep networks are still at the pixel-level learning stage, either performing end-to-end pixel-level restoration or stage-wise pseudo kernel-level restoration, failing to enable the deblur model to understand the essence of the blur. To this end, we propose Fourier Kernel Estimator (FKE), which considers the activation operation in Fourier space and converts the convolution problem in the spatial domain to a multiplication problem in Fourier space. Our FKE, jointly optimized with the deblur model, enables the network to learn the kernel-level blur process with low complexity and without any additional supervision. Furthermore, we change the convolution object of the kernel from ``image" to network extracted ``feature", whose rich semantic and structural information is more suitable to blur process learning. With the convolution of the feature and the estimated kernel, our model can learn the essence of blur in kernel-level. To further improve the efficiency of feature extraction, we design a decoupled multi-scale architecture with multiple hierarchical sub-unets with a reversible strategy, which allows better multi-scale encoding and decoding in low training memory. Extensive experiments indicate that our method achieves state-of-the-art motion deblurring results and show potential for handling other kernel-related problems. Analysis also shows our kernel estimator is able to learn physically meaningful kernels. The code will be available at https://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur.
- Abstract(参考訳): ネットワークがデブロアを学ぼうとするなら、その曖昧なプロセスを理解するべきであることはよく知られている。
ブラッシングは、シャープ画像とぼやけたカーネルとの畳み込みによって自然に発生する。
これにより、カーネルレベルでのぼやけた処理をネットワークで学べるようにすることで、画像劣化性能を大幅に向上させることができる。
しかし、現在のディープネットワークはまだピクセルレベルの学習段階にあり、エンド・ツー・エンドのピクセルレベルの復元や、ステージ単位の擬似カーネルレベルの復元を行うかのいずれかを行う。
この目的のために、フーリエ空間における活性化操作を考慮し、空間領域における畳み込み問題をフーリエ空間における乗算問題に変換するフーリエカーネル推定器(FKE)を提案する。
我々のFKEはデブロアモデルと共同で最適化されており、ネットワークは複雑さが低く、追加の監督なしにカーネルレベルのぼやけたプロセスを学ぶことができる。
さらに、カーネルの畳み込みオブジェクトを `image' から "feature" へ変更する。
この特徴と推定されたカーネルの畳み込みにより、我々のモデルはカーネルレベルの曖昧さの本質を学ぶことができる。
特徴抽出の効率をさらに高めるため,低トレーニングメモリにおけるマルチスケール符号化と復号化を向上する,可逆的な戦略で複数の階層的なサブユニットを持つデカップリング型マルチスケールアーキテクチャを設計する。
実験の結果,提案手法は最先端の動作不良を解消し,他のカーネル関連問題に対処できる可能性が示唆された。
分析により、我々のカーネル推定器は物理的に意味のあるカーネルを学習できることを示している。
コードはhttps://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur.comから入手できる。
関連論文リスト
- LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - NSD-DIL: Null-Shot Deblurring Using Deep Identity Learning [0.02932486408310998]
本稿では,線形システムの特性に基づいた専用正規化項を含む新しい学習戦略であるDeep Identity Learning (DIL)を紹介する。
画像データに依存しないため、我々はDeep Identity Learning (NSD-DIL)を用いてNull-Shot deblurringと呼ぶ。
実験の結果,提案手法は従来の学習法と深層学習法の両方に優れていた。
論文 参考訳(メタデータ) (2024-07-05T18:56:31Z) - Blind Image Deblurring with FFT-ReLU Sparsity Prior [1.179778723980276]
ブラインドイメージデブロアリング(Blind image deblurring)は、ぼやけたカーネルに関する事前知識のないぼやけたイメージからシャープなイメージを復元するプロセスである。
画像の種類を多岐にわたって効果的に劣化させるために,ぼやけたカーネルを対象とする先行処理を利用する手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T15:51:39Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Learning with convolution and pooling operations in kernel methods [8.528384027684192]
近年の実証研究により、階層的畳み込みカーネルは、画像分類タスクにおけるカーネルメソッドの性能を向上させることが示されている。
畳み込みアーキテクチャにおける近似と一般化の正確な相互作用について検討する。
この結果から,対象関数に適応したアーキテクチャの選択が,サンプルの複雑性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2021-11-16T09:00:44Z) - Content-Aware Convolutional Neural Networks [98.97634685964819]
畳み込みニューラルネットワーク(CNN)は、畳み込み層の強力な特徴学習能力によって大きな成功を収めている。
本研究では,スムーズなウィンドウを自動的に検出し,元の大規模カーネルを置き換えるために1x1畳み込みカーネルを適用するContent-aware Convolution (CAC)を提案する。
論文 参考訳(メタデータ) (2021-06-30T03:54:35Z) - Explore Image Deblurring via Blur Kernel Space [17.67255729783263]
ブラインド画像の解読のための交互最適化アルゴリズムを提案する。
符号化された空間内のカーネルによって見えないぼかし演算子を近似し、対応するシャープイメージを検索する。
任意のデータセットから既存のぼかし演算子を新しいドメインに転送することで、ぼかし合成に使用できる。
論文 参考訳(メタデータ) (2021-04-01T07:52:53Z) - Blur Invariant Kernel-Adaptive Network for Single Image Blind deblurring [0.886014926770622]
本稿では,ぼやけたカーネルに関する情報を利用する,新しい,目が見えない,シングルイメージのデブロアリング手法を提案する。
まず、ぼやけた画像の分析に基づいて、適応的なぼやけたカーネルを生成するカーネル推定ネットワークを導入する。
本稿では,推定したぼやけたカーネルを用いて,シャープな画像を復元するデブロワーリングネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-09T03:53:33Z) - Neural Sparse Representation for Image Restoration [116.72107034624344]
スパース符号化に基づく画像復元モデルの堅牢性と効率に触発され,深部ネットワークにおけるニューロンの空間性について検討した。
本手法は,隠れたニューロンに対する空間的制約を構造的に強制する。
実験により、複数の画像復元タスクのためのディープニューラルネットワークではスパース表現が不可欠であることが示されている。
論文 参考訳(メタデータ) (2020-06-08T05:15:17Z) - Deblurring using Analysis-Synthesis Networks Pair [6.09170287691728]
ブラインド画像の劣化は、現代のニューラルネットワークにとって難しい問題である。
そこで我々は,デブロワーリングネットワークを,そのボケを推定する解析ネットワークに分割する新たなアーキテクチャと,このカーネルを用いて画像をデブロワーする合成ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-06T19:32:51Z) - Deep Blind Video Super-resolution [85.79696784460887]
本稿では,ビデオSRを曖昧なカーネルモデリング手法により解くために,深層畳み込みニューラルネットワーク(CNN)モデルを提案する。
提案したCNNモデルは、動きのぼかし推定、動きの推定、遅延画像復元モジュールからなる。
提案アルゴリズムは, より微細な構造情報を用いて, より鮮明な画像を生成することができることを示す。
論文 参考訳(メタデータ) (2020-03-10T13:43:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。