論文の概要: Wavelet-Assisted Multi-Frequency Attention Network for Pansharpening
- arxiv url: http://arxiv.org/abs/2502.04903v1
- Date: Fri, 07 Feb 2025 13:15:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:57:23.956083
- Title: Wavelet-Assisted Multi-Frequency Attention Network for Pansharpening
- Title(参考訳): パンシャーピングのためのウェーブレット支援多周波数アテンションネットワーク
- Authors: Jie Huang, Rui Huang, Jinghao Xu, Siran Pen, Yule Duan, Liangjian Deng,
- Abstract要約: Pansharpeningは、高分解能パンクロマティック(PAN)画像と低分解能マルチスペクトル(LRMS)画像を組み合わせて高分解能マルチスペクトル(HRMS)画像を作成することを目的としている。
周波数領域におけるパンシャルペンは明らかな利点があるが、既存のほとんどの手法は空間領域でのみ動作するか、周波数領域の利点を完全に活用できないかのいずれかである。
本稿では、ウェーブレット変換を利用したMFFA(Multi-Frequency Fusion Attention)を提案する。
- 参考スコア(独自算出の注目度): 15.77836708727337
- License:
- Abstract: Pansharpening aims to combine a high-resolution panchromatic (PAN) image with a low-resolution multispectral (LRMS) image to produce a high-resolution multispectral (HRMS) image. Although pansharpening in the frequency domain offers clear advantages, most existing methods either continue to operate solely in the spatial domain or fail to fully exploit the benefits of the frequency domain. To address this issue, we innovatively propose Multi-Frequency Fusion Attention (MFFA), which leverages wavelet transforms to cleanly separate frequencies and enable lossless reconstruction across different frequency domains. Then, we generate Frequency-Query, Spatial-Key, and Fusion-Value based on the physical meanings represented by different features, which enables a more effective capture of specific information in the frequency domain. Additionally, we focus on the preservation of frequency features across different operations. On a broader level, our network employs a wavelet pyramid to progressively fuse information across multiple scales. Compared to previous frequency domain approaches, our network better prevents confusion and loss of different frequency features during the fusion process. Quantitative and qualitative experiments on multiple datasets demonstrate that our method outperforms existing approaches and shows significant generalization capabilities for real-world scenarios.
- Abstract(参考訳): Pansharpeningは、高分解能パンクロマティック(PAN)画像と低分解能マルチスペクトル(LRMS)画像を組み合わせて高分解能マルチスペクトル(HRMS)画像を作成することを目的としている。
周波数領域におけるパンシャルペンは明らかな利点があるが、既存のほとんどの手法は空間領域でのみ動作するか、周波数領域の利点を完全に活用できないかのいずれかである。
この問題に対処するために,ウェーブレット変換を利用して周波数領域をきれいに分離し,周波数領域間のロスレス再構成を可能にするMFFA(Multi-Frequency Fusion Attention)を提案する。
次に、異なる特徴によって表される物理的意味に基づいて、周波数クエリ、空間キー、融合値を生成し、周波数領域における特定の情報のより効果的なキャプチャを可能にする。
さらに,異なる操作の周波数特性の保存にも着目する。
より広いレベルでは、我々のネットワークはウェーブレットピラミッドを使用して、複数のスケールで情報を段階的に融合する。
従来の周波数領域アプローチと比較して,ネットワークは融合過程における異なる周波数特性の混乱や損失を防止している。
複数のデータセットに対する定量的および定性的な実験により,本手法が既存手法より優れ,実世界のシナリオに対して重要な一般化能力を示すことが示された。
関連論文リスト
- FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9040167152168]
CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - Exploring Richer and More Accurate Information via Frequency Selection for Image Restoration [0.0]
空間および周波数領域の知識をシームレスに統合するマルチスケール周波数選択ネットワーク(MSFSNet)を導入する。
我々のMSFSNetは最先端のアルゴリズムに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2024-07-12T03:10:08Z) - Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.28680499480492]
パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文 参考訳(メタデータ) (2024-01-04T08:58:25Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Both Spatial and Frequency Cues Contribute to High-Fidelity Image
Inpainting [9.080472817672263]
深部生成的アプローチは、近年、画像の塗布において大きな成功を収めている。
ほとんどの生成的塗布ネットワークは、過度に滑らかな結果か、アーティファクトのエイリアスに悩まされている。
本研究では、空間領域と周波数領域の両方において、リッチな意味情報を活用することで、周波数空間補間ネットワーク(FSCN)を提案する。
論文 参考訳(メタデータ) (2023-07-15T01:52:06Z) - Multi-Scale Wavelet Transformer for Face Forgery Detection [43.33712402517951]
顔偽造検出のためのマルチスケールウェーブレットトランスフォーマフレームワークを提案する。
周波数に基づく空間的注意は、空間的特徴抽出器をフォージェリトレースに集中させるよう誘導するように設計されている。
空間的特徴と周波数特徴を融合させるため,モーダリティ間の注意が提案されている。
論文 参考訳(メタデータ) (2022-10-08T03:39:36Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。