論文の概要: Spatial-Frequency Gated Swin Transformer for Remote Sensing Single-Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2605.09687v1
- Date: Sun, 10 May 2026 18:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.372078
- Title: Spatial-Frequency Gated Swin Transformer for Remote Sensing Single-Image Super-Resolution
- Title(参考訳): リモートセンシング単一画像超解像のための空間周波数ゲート型スイム変換器
- Authors: Md Aminur Hossain, Parekh Valkesh, Ayush V. Patel, Yogesh Jethani, Sanjay K. Singh, Biplab Banerjee,
- Abstract要約: リモートセンシングにおける単一画像超解像のための空間周波数Gated Swin TransformerであるSFG-SwinSRを提案する。
モジュールは、深度方向のブルー分岐を介して低周波コンテンツを推定し、減算により高周波残留物を抽出し、軽量な空間分岐で精製し、ボトルネックゲートを介して詳細を適応的に注入する。
- 参考スコア(独自算出の注目度): 15.528333055984646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote Sensing (RS) single-image super-resolution aims to reconstruct high-resolution imagery from low-resolution observations while preserving fine spatial structures. Recent Swin Transformer-based models, including Swin2SR, provide strong spatial context modeling throughshifted-window self-attention, but their feed-forward networks remain generic channel-mixing modules and do not separate low-frequency structural content from high-frequency residual detail. To address this limitation, we propose SFG-SwinSR, a Spatial-Frequency Gated Swin Transformer for single-image super-resolution in remote sensing. SFG-SwinSR modifies the original Swin2SR attention block by replacing each transformer block's standard feed-forward network with a lightweight Spatial-Frequency Gated Feed-Forward Network (SFG-FFN). The module estimates low-frequency content via a depthwise-blur branch, extracts high-frequency residuals by subtraction, refines them with a lightweight spatial branch, and adaptively injects detail through a bottleneck gate. Experiments on SpaceNet and SEN2VENμS show that SFG-SwinSR improves reconstruction quality under the evaluated settings. On SpaceNet, it achieves 45.19 dB PSNR and 0.9852 SSIM, indicating effective enhancement of high-frequency details. This demonstrates that spatial-frequency transformation within the transformer feed-forward network improves detail reconstruction in RS super-resolution.
- Abstract(参考訳): リモートセンシング(RS)超解像は、微細な空間構造を保ちながら低分解能観測から高分解能画像を再構成することを目的としている。
Swin2SRを含む最近のSwin Transformerベースのモデルは、強い空間コンテキストモデリングを提供するが、フィードフォワードネットワークは一般的なチャネル混合モジュールのままであり、高周波残差の詳細から低周波構造コンテンツを分離しない。
この制限に対処するため,SFG-SwinSR(Spatial-Frequency Gated Swin Transformer)を提案する。
SFG-SwinSRは、各トランスフォーマーブロックの標準フィードフォワードネットワークを軽量な空間周波数ゲートフィードフォワードネットワーク(SFG-FFN)に置き換えることで、オリジナルのSwin2SRアテンションブロックを変更する。
モジュールは、深度方向のブルー分岐を介して低周波コンテンツを推定し、減算により高周波残留物を抽出し、軽量な空間分岐で精製し、ボトルネックゲートを介して詳細を適応的に注入する。
SpaceNet と SEN2VENμS の実験により,SFG-SwinSR は評価条件下での再構成品質を向上させることが示された。
SpaceNetでは、45.19dBのPSNRと0.9852のSSIMを実現し、高周波の詳細を効果的に強化している。
このことは、トランスフィードフォワードネットワーク内の空間周波数変換がRS超解像における詳細再構成を改善することを示す。
関連論文リスト
- WaveHiT-SR: Hierarchical Wavelet Network for Efficient Image Super-Resolution [44.55918322585521]
我々は(WaveHiT-SR)と呼ばれる階層型トランスフォーマーフレームワークにウェーブレット変換を埋め込み、新しいアプローチを提案する。
階層的な処理によって徐々に高解像度画像を再構成することにより、性能を犠牲にすることなく計算複雑性を低減させる。
SwinIR-Light, SwinIR-NG, SRFormer-Light の洗練されたバージョンでは最先端のSR結果が得られ, パラメータが少なく, FLOP が小さくなり, 高速化された。
論文 参考訳(メタデータ) (2025-08-27T14:37:50Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - FANeRV: Frequency Separation and Augmentation based Neural Representation for Video [32.35716293561769]
ビデオのための周波数分離と拡張に基づくニューラル表現(FANeRV)を提案する。
FANeRVは離散ウェーブレット変換を用いて入力フレームを高周波数成分と低周波数成分に明示的に分離する。
特別に設計されたゲートネットワークは、これらの周波数成分を効果的に融合して最適な再構成を行う。
論文 参考訳(メタデータ) (2025-04-09T10:19:35Z) - Dual-domain Modulation Network for Lightweight Image Super-Resolution [26.992373105057684]
軽量画像超解像(SR)は、低解像度画像から限られた計算コストで高解像度画像を再構成することを目的としている。
既存の周波数ベースSR法では、全体構造と高周波部品の再構築のバランスが取れない。
本稿では,ウェーブレット情報とフーリエ情報の両方を導入することで,コスト削減を図りながら,高周波特徴と全体のSR構造再構築を両立させることができることを示す。
論文 参考訳(メタデータ) (2025-03-13T04:59:46Z) - Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。
より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。
我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文 参考訳(メタデータ) (2024-05-08T11:09:24Z) - Lightweight Structure-aware Transformer Network for VHR Remote Sensing
Image Change Detection [15.391216316828354]
RS画像CDのための軽量構造対応トランス (LSAT) ネットワークを提案する。
まず、線形複雑度を有するクロス次元インタラクティブ自己注意(CISA)モジュールは、視覚変換器におけるバニラ自己注意を置き換えるように設計されている。
第二に、SAEM(Structure-Aware Enhancement Module)は、差分特徴とエッジ詳細情報を強化するために設計されている。
論文 参考訳(メタデータ) (2023-06-03T03:21:18Z) - Structured Sparsity Learning for Efficient Video Super-Resolution [99.1632164448236]
我々は、ビデオ超解像(VSR)モデルの特性に応じて、構造化スパシティ学習(SSL)と呼ばれる構造化プルーニング手法を開発する。
SSLでは,残差ブロック,リカレントネットワーク,アップサンプリングネットワークなど,VSRモデルのいくつかの重要なコンポーネントに対するプルーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-06-15T17:36:04Z) - BSRT: Improving Burst Super-Resolution with Swin Transformer and
Flow-Guided Deformable Alignment [84.82352123245488]
この研究は新しいアーキテクチャを使ってBurst Super-Resolution (BurstSR)タスクに対処し、ノイズ、不一致、低解像度のRAWバーストから高品質な画像を復元する必要がある。
本稿では,フレーム間情報抽出と再構築の能力を大幅に向上するBurst Super-Resolution Transformer (BSRT)を提案する。
我々のBSRTはNTIRE2022 Burst Super-Resolution Challengeで優勝した。
論文 参考訳(メタデータ) (2022-04-18T14:23:10Z) - FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete
Cosine Transform [16.439669339293747]
単一画像超解像(SISR)は低分解能(LR)入力から高分解能(HR)出力を得ることを目的とした不適切な問題である。
高ピーク信号-雑音比(PSNR)の結果にもかかわらず、モデルが望まれる高周波の詳細を正しく付加するかどうかを判断することは困難である。
本稿では、周波数領域の観点から直感的なパイプラインであるFreqNetを提案し、この問題を解決する。
論文 参考訳(メタデータ) (2021-11-21T11:49:12Z) - TWIST-GAN: Towards Wavelet Transform and Transferred GAN for
Spatio-Temporal Single Image Super Resolution [4.622977798361014]
単一画像スーパーレゾリューション(sisr)は、空間解像度の低いリモートセンシング画像から、微細な空間解像度を持つ高解像度画像を生成する。
深層学習とGAN(Generative Adversarial Network)は、単一画像超解像(SISR)の課題を突破した。
論文 参考訳(メタデータ) (2021-04-20T22:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。