論文の概要: Fourier-Guided Attention Upsampling for Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2508.10616v1
- Date: Thu, 14 Aug 2025 13:13:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.322323
- Title: Fourier-Guided Attention Upsampling for Image Super-Resolution
- Title(参考訳): 超解像のためのフーリエガイドアテンションアップサンプリング
- Authors: Daejune Choi, Youchan No, Jinhyung Lee, Duksu Kim,
- Abstract要約: 周波数誘導アテンション(英: Frequency-Guided Attention, FGA)は、単一画像の超解像のための軽量アップサンプリングモジュールである。
試験の結果、PSNRの平均利得は0.120.14dB、周波数領域の整合性は最大29%向上した。
- 参考スコア(独自算出の注目度): 0.44998333629984877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Frequency-Guided Attention (FGA), a lightweight upsampling module for single image super-resolution. Conventional upsamplers, such as Sub-Pixel Convolution, are efficient but frequently fail to reconstruct high-frequency details and introduce aliasing artifacts. FGA addresses these issues by integrating (1) a Fourier feature-based Multi-Layer Perceptron (MLP) for positional frequency encoding, (2) a cross-resolution Correlation Attention Layer for adaptive spatial alignment, and (3) a frequency-domain L1 loss for spectral fidelity supervision. Adding merely 0.3M parameters, FGA consistently enhances performance across five diverse super-resolution backbones in both lightweight and full-capacity scenarios. Experimental results demonstrate average PSNR gains of 0.12~0.14 dB and improved frequency-domain consistency by up to 29%, particularly evident on texture-rich datasets. Visual and spectral evaluations confirm FGA's effectiveness in reducing aliasing and preserving fine details, establishing it as a practical, scalable alternative to traditional upsampling methods.
- Abstract(参考訳): 単一画像超解像のための軽量アップサンプリングモジュールである周波数誘導注意(FGA)を提案する。
サブピクセル・コンボリューション(英語版)のような従来のアップサンプラーは効率的であるが、しばしば高周波の細部を再構築し、エイリアシングアーティファクトを導入するのに失敗する。
FGAは、(1)位置周波数符号化のためのフーリエ特徴に基づく多層受容器(MLP)、(2)適応空間アライメントのためのクロスレゾリューション対応アテンション層、(3)スペクトル忠実度監視のための周波数領域L1損失を統合することで、これらの課題に対処する。
0.3Mパラメータのみを追加することで、FGAは軽量とフルキャパシティの両方のシナリオにおいて、5つの多様な超解像度バックボーンのパフォーマンスを一貫して向上させる。
実験の結果, 平均PSNRゲインは0.12~0.14dBとなり, 周波数領域の整合性は最大29%向上した。
視覚的およびスペクトル的評価は、FGAがエイリアス化を減らし、細部を保存し、従来のアップサンプリング法に代わる実用的でスケーラブルな方法として確立する効果を確認している。
関連論文リスト
- FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Dual-domain Modulation Network for Lightweight Image Super-Resolution [26.992373105057684]
軽量画像超解像(SR)は、低解像度画像から限られた計算コストで高解像度画像を再構成することを目的としている。
既存の周波数ベースSR法では、全体構造と高周波部品の再構築のバランスが取れない。
本稿では,ウェーブレット情報とフーリエ情報の両方を導入することで,コスト削減を図りながら,高周波特徴と全体のSR構造再構築を両立させることができることを示す。
論文 参考訳(メタデータ) (2025-03-13T04:59:46Z) - F2former: When Fractional Fourier Meets Deep Wiener Deconvolution and Selective Frequency Transformer for Image Deblurring [8.296475046681696]
本稿では、空間周波数の統一表現であるFRFT(Fractional Fourier Transform)に基づく新しい手法を提案する。
提案手法の性能は,他のSOTA手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-09-03T17:05:12Z) - FreqINR: Frequency Consistency for Implicit Neural Representation with Adaptive DCT Frequency Loss [5.349799154834945]
本稿では、新しい任意スケール超解像法であるFreqINR(FreqINR)について述べる。
トレーニングでは,適応離散コサイン変換周波数損失(adaptive Discrete Cosine Transform Frequency Loss,ADFL)を用いて,HR画像と地絡画像の周波数ギャップを最小化する。
推論の際には,低分解能(LR)画像と地軸画像のスペクトルコヒーレンスを維持するために受容場を拡張した。
論文 参考訳(メタデータ) (2024-08-25T03:53:17Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - Unpaired Optical Coherence Tomography Angiography Image Super-Resolution via Frequency-Aware Inverse-Consistency GAN [6.717440708401628]
本稿では,GANに基づくOCTA画像の非ペア化超解像法を提案する。
また,再構成画像の正確なスペクトル化を容易にするため,識別器の周波数認識による逆方向の損失も提案する。
実験により,本手法は,他の最先端の未経験手法よりも定量的,視覚的に優れていることが示された。
論文 参考訳(メタデータ) (2023-09-29T14:19:51Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。