論文の概要: Spatial-Frequency Attention for Image Denoising
- arxiv url: http://arxiv.org/abs/2302.13598v1
- Date: Mon, 27 Feb 2023 09:07:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 16:13:51.244451
- Title: Spatial-Frequency Attention for Image Denoising
- Title(参考訳): 画像の雑音化のための空間周波数注意
- Authors: Shi Guo, Hongwei Yong, Xindong Zhang, Jianqi Ma and Lei Zhang
- Abstract要約: 本研究では,長距離依存性を利用した空間周波数アテンションネットワーク(SFANet)を提案する。
複数のdenoisingベンチマークの実験は、SFANetネットワークのリードパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 22.993509525990998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recently developed transformer networks have achieved impressive
performance in image denoising by exploiting the self-attention (SA) in images.
However, the existing methods mostly use a relatively small window to compute
SA due to the quadratic complexity of it, which limits the model's ability to
model long-term image information. In this paper, we propose the
spatial-frequency attention network (SFANet) to enhance the network's ability
in exploiting long-range dependency. For spatial attention module (SAM), we
adopt dilated SA to model long-range dependency. In the frequency attention
module (FAM), we exploit more global information by using Fast Fourier
Transform (FFT) by designing a window-based frequency channel attention (WFCA)
block to effectively model deep frequency features and their dependencies. To
make our module applicable to images of different sizes and keep the model
consistency between training and inference, we apply window-based FFT with a
set of fixed window sizes. In addition, channel attention is computed on both
real and imaginary parts of the Fourier spectrum, which further improves
restoration performance. The proposed WFCA block can effectively model image
long-range dependency with acceptable complexity. Experiments on multiple
denoising benchmarks demonstrate the leading performance of SFANet network.
- Abstract(参考訳): 近年開発されたトランスフォーマーネットワークは,画像の自己着脱(自己着脱)を活用し,画像の有意な性能を実現している。
しかし、既存の手法は2次複雑性のためにsaを計算するために比較的小さなウィンドウを使い、長期画像情報をモデル化するモデルの能力を制限する。
本稿では,長距離依存性を利用した空間周波数アテンションネットワーク(SFANet)を提案する。
空間的注意モジュール(SAM)については,拡張SAを用いて長距離依存性をモデル化する。
周波数アテンションモジュール (fam) では、ウィンドウベースの周波数チャンネルアテンション (wfca) ブロックを設計し、深い周波数特徴とその依存関係を効果的にモデル化することで、よりグローバルな情報を活用する。
モジュールを異なるサイズの画像に適用し、トレーニングと推論の間のモデルの一貫性を保つために、固定されたウィンドウサイズを持つウィンドウベースのfftを適用する。
さらに、フーリエスペクトルの実部と虚部の両方でチャネルの注意が計算され、さらに復元性能が向上する。
提案するwfcaブロックは画像の長距離依存性を効果的にモデル化できる。
複数のdenoisingベンチマークの実験は、SFANetネットワークのリードパフォーマンスを示している。
関連論文リスト
- Channel-Partitioned Windowed Attention And Frequency Learning for Single Image Super-Resolution [1.8506868409351092]
ウィンドウベースのアテンション手法は特にSingle Image Super-Resolution (SISR)においてコンピュータビジョンタスクに大きな可能性を示している。
特徴マップの高さと幅に沿ってウィンドウを逐次拡大することにより、長距離依存をよりよく捉えるために、チャネル分割型注意変換器(CPAT)を提案する。
さらに、空間・周波数相互作用モジュール(Spatial-Frequency Interaction Module, SFIM)を提案する。
論文 参考訳(メタデータ) (2024-07-23T07:17:10Z) - Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models [26.926712014346432]
本稿では,新しいマルチレゾリューションネットワークと時間依存層正規化を統合することで,拡散モデルの革新的拡張を提案する。
提案手法の有効性は,ImageNet 256 x 256で1.70,ImageNet 512 x 512で2.89の新しい最先端FIDスコアを設定することで,クラス条件のImageNet生成ベンチマークで実証される。
論文 参考訳(メタデータ) (2024-06-13T17:59:58Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Spatial-Frequency U-Net for Denoising Diffusion Probabilistic Models [89.76587063609806]
画素空間の代わりにウェーブレット空間における拡散確率モデル(DDPM)を視覚合成のために検討した。
ウェーブレット信号を明示的にモデル化することで、我々のモデルは複数のデータセット上でより高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-27T06:53:16Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z) - Multi-scale frequency separation network for image deblurring [10.511076996096117]
本稿では,マルチスケール周波数分離ネットワーク (MSFS-Net) を用いた画像分解手法を提案する。
MSFS-Netは複数のスケールで画像の低周波・高周波情報をキャプチャする。
ベンチマークデータセットの実験により,提案したネットワークが最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2022-06-01T23:48:35Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。