論文の概要: CGFformer: Cluster-Guidance Frequency Transformer for Pansharpening
- arxiv url: http://arxiv.org/abs/2605.01490v1
- Date: Sat, 02 May 2026 15:27:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.801228
- Title: CGFformer: Cluster-Guidance Frequency Transformer for Pansharpening
- Title(参考訳): CGFformer:パンシャーペン用クラスター誘導周波数変換器
- Authors: Zijian Zhou, Jianing Zhang, Kai Sun, Xiangyu Zhao, Chunxia Zhang, Xiangyong Cao,
- Abstract要約: CGFformerは、周波数分布の変化と周波数と空間成分間の相互作用に焦点を当てたクラスタ誘導周波数変換器である。
本稿では,トランスフォーマーをベースとしたクロスアテンションと組み合わせて,様々なノイズを除去し,周波数関連障害と無関係障害をネットワークが共同で抑制する2重ストリームリファインメントモジュールを提案する。
さらに、詳細性を高め、空間-周波数相互作用を容易にするために、周波数-空間融合モジュールを開発する。
- 参考スコア(独自算出の注目度): 29.89030492050345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pansharpening aims to generate high-resolution multispectral (HRMS) images by fusing low-resolution multispectral (LRMS) images with high-resolution panchromatic (PAN) images. However, the current mainstream frequency-based pansharpening methods employ fixed frequency filters, which cannot precisely adapt to complex and spatially diversified frequency distributions in PAN and MS images. Furthermore, existing denoising strategies insufficiently exploit frequency components for denoising and struggle to suppress various noise types accurately. To address these challenges, we propose CGFformer, a cluster-guidance frequency Transformer that focuses on varying frequency distribution and interactions between frequency and spatial components. Specifically, we design an adaptive separation module that integrates local features and non-local information through K-means clustering, enabling more precise separation of high- and low-frequency components. Subsequently, we introduce a dual-stream refinement module combined with Transformer-based cross-attention to remove various noise, allowing the network to jointly suppress frequency-relevant and irrelevant disturbances. In addition, we develop a frequency-spatial fusion module designed to enhance detail and facilitate spatial-frequency interaction, ensuring more effective reconstruction of spatial structures in the fused results. Extensive experiments on multiple benchmark datasets demonstrate that the proposed CGFformer achieves notable improvements over existing pansharpening approaches.
- Abstract(参考訳): Pansharpeningは、高分解能パンクロマティック(PAN)画像と低分解能マルチスペクトル(LRMS)画像を融合させることで、高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。
しかし、現在の主流周波数ベースのパンシャルペン法では固定周波数フィルタを用いており、PANおよびMS画像の複素および空間的に異なる周波数分布に正確に適応できない。
さらに、既存の遮音対策では、様々なノイズタイプを正確に抑えるのに十分な周波数成分を活用できない。
これらの課題に対処するために,周波数分布の変化と周波数と空間成分間の相互作用に着目したクラスタ誘導周波数変換器CGFformerを提案する。
具体的には、K平均クラスタリングにより局所特徴と非局所情報を統合する適応分離モジュールを設計し、高周波数成分と低周波数成分のより正確な分離を可能にする。
その後、トランスフォーマーをベースとしたクロスアテンションと組み合わされたデュアルストリームリファインメントモジュールを導入し、様々なノイズを除去し、ネットワークが周波数関連障害と無関係障害を共同的に抑制できるようにする。
さらに,詳細性を高め,空間-周波数相互作用を容易にし,融合結果における空間構造のより効率的な再構築を実現するために,周波数-空間融合モジュールを開発した。
複数のベンチマークデータセットに対する大規模な実験は、提案したCGFformerが既存のパンシャーピングアプローチよりも顕著に改善されていることを示している。
関連論文リスト
- RAFNet: Region-Aware Fusion Network for Pansharpening [11.479836028539859]
本研究では,高分解能マルチスペクトル画像を生成するための領域認識融合ネットワーク(RAFNet)を提案する。
セマンティッククラスタによって案内されるスパースアテンション機構を導入し、領域対応のスパースアテンション戦略を実行する。
RAFNetは、縮小およびフルレゾリューション評価の両方において最先端のパンシャーピング手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-05-04T03:26:57Z) - Iterative Inference-time Scaling with Adaptive Frequency Steering for Image Super-Resolution [75.3690742776891]
適応周波数ステアリング(IAFS)を用いた反復拡散推論時間スケーリングを提案する。
IAFSは、構造的偏差の反復的補正によって生成した画像を徐々に精細化することで、知覚品質と構造的忠実性のバランスをとるという課題に対処する。
実験の結果、IAFSは知覚と忠実性の対立を効果的に解決し、知覚の細部と構造的精度を一貫して改善し、既存の推論時間スケーリング手法よりも優れていた。
論文 参考訳(メタデータ) (2025-12-29T15:09:20Z) - Diffusion Transformer meets Multi-level Wavelet Spectrum for Single Image Super-Resolution [15.056888813012451]
SR(DTWSR)のための画像ウェーブレットスペクトルに基づく拡散変換器モデルを提案する。
DTWSRは拡散モデルと変圧器の優位性を取り入れ、マルチスケール周波数サブバンド間の相互関係を捉える。
デュアルデコーダは、画像生成におけるアライメントを省略することなく、低周波サブバンドと高周波サブバンドの異なるばらつきを扱うよう精巧に設計されている。
論文 参考訳(メタデータ) (2025-11-03T02:56:58Z) - Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation [0.0]
FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。
我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。
複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-23T06:51:24Z) - QMambaBSR: Burst Image Super-Resolution with Query State Space Model [55.56075874424194]
バースト超解像度は、複数のバースト低解像度フレームからサブピクセル情報を融合することにより、高画質でよりリッチな細部で高解像度の画像を再構成することを目的としている。
BusrtSRにおいて鍵となる課題は、高周波ノイズ障害を同時に抑制しつつ、ベースフレームの補完的なサブピクセルの詳細を抽出することである。
本稿では,Query State Space Model (QSSM) とAdaptive Up-Sampling Module (AdaUp) を組み合わせた新しいQuery Mamba Burst Super-Resolution (QMambaBSR) ネットワークを紹介する。
論文 参考訳(メタデータ) (2024-08-16T11:15:29Z) - Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.28680499480492]
パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文 参考訳(メタデータ) (2024-01-04T08:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。