論文の概要: PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification
- arxiv url: http://arxiv.org/abs/2504.19136v1
- Date: Sun, 27 Apr 2025 07:21:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.145614
- Title: PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification
- Title(参考訳): PAD:多モード土地被覆分類のための位相振幅デカップリング核融合
- Authors: Huiling Zheng, Xian Zhong, Bin Liu, Yi Xiao, Bihan Wen, Xiaofeng Li,
- Abstract要約: フーリエ領域における位相(モダリティ共有)と振幅(モダリティ固有)を分離する周波数対応フレームワークである位相振幅デカップリング(PAD)を提案する。
PADは, 位相スペクトル補正 (PSC) と位相差補正 (ASF) の2つの主要成分から構成される。
我々の研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する
- 参考スコア(独自算出の注目度): 30.563079264213112
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The fusion of Synthetic Aperture Radar (SAR) and RGB imagery for land cover classification remains challenging due to modality heterogeneity and the underutilization of spectral complementarity. Existing methods often fail to decouple shared structural features from modality-specific radiometric attributes, leading to feature conflicts and information loss. To address this issue, we propose Phase-Amplitude Decoupling (PAD), a frequency-aware framework that separates phase (modality-shared) and amplitude (modality-specific) components in the Fourier domain. Specifically, PAD consists of two key components: 1) Phase Spectrum Correction (PSC), which aligns cross-modal phase features through convolution-guided scaling to enhance geometric consistency, and 2) Amplitude Spectrum Fusion (ASF), which dynamically integrates high-frequency details and low-frequency structures using frequency-adaptive multilayer perceptrons. This approach leverages SAR's sensitivity to morphological features and RGB's spectral richness. Extensive experiments on WHU-OPT-SAR and DDHR-SK datasets demonstrate state-of-the-art performance. Our work establishes a new paradigm for physics-aware multi-modal fusion in remote sensing. The code will be available at https://github.com/RanFeng2/PAD.
- Abstract(参考訳): 陸域被覆分類のための合成開口レーダ(SAR)とRGB画像の融合は、モダリティの不均一性とスペクトル相補性の未利用により、依然として困難である。
既存の方法では、共有構造的特徴とモダリティ固有の放射能特性を分離できないことが多く、特徴的矛盾や情報損失につながる。
この問題を解決するために、フーリエ領域における位相(モダリティ共有)と振幅(モダリティ固有)を分離する周波数対応フレームワークである位相振幅デカップリング(PAD)を提案する。
具体的には、PADは2つのキーコンポーネントから構成される。
1)位相スペクトル補正(PSC)は、畳み込み誘導スケーリングにより、幾何的整合性を高めることで、異方性相の特徴を整列する。
2)周波数適応型多層パーセプトロンを用いた高周波細部と低周波構造を動的に統合した振幅スペクトル核融合(ASF)。
このアプローチは、SARの感度を形態的特徴とRGBのスペクトルリッチ性に活用する。
WHU-OPT-SARとDDHR-SKデータセットに関する大規模な実験は、最先端のパフォーマンスを示している。
我々の研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
コードはhttps://github.com/RanFeng2/PAD.comから入手できる。
関連論文リスト
- FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Unleashing Correlation and Continuity for Hyperspectral Reconstruction from RGB Images [64.80875911446937]
RGB画像からのHSI再構成のための相関連続性ネットワーク(CCNet)を提案する。
局所スペクトルの相関について,GrSCM(Group-wise Spectral correlation Modeling)モジュールを紹介する。
グローバルスペクトルの連続性のために、我々はNeSCMモジュールを設計する。
論文 参考訳(メタデータ) (2025-01-02T15:14:40Z) - Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection [8.607385112274882]
深層学習は、RGB画像と熱画像(RGB-T画像)を併用したサルエント物体検出(SOD)を大幅に改善した。
既存のディープラーニングベースのRGB-T SODモデルには2つの大きな制限がある。
本稿では,DFENet(Deep Fourier-Embedded Network)という,純粋なフーリエ変換モデルを提案する。
論文 参考訳(メタデータ) (2024-11-27T14:55:16Z) - SSDiff: Spatial-spectral Integrated Diffusion Model for Remote Sensing Pansharpening [14.293042131263924]
本稿では,空間スペクトル統合拡散モデルを導入し,リモートセンシングパンシャーピングタスクであるSSDiffについて述べる。
SSDiffは、パンシャルペン過程を部分空間分解の観点から、空間成分とスペクトル成分の融合過程とみなしている。
論文 参考訳(メタデータ) (2024-04-17T16:30:56Z) - A Dual Domain Multi-exposure Image Fusion Network based on the
Spatial-Frequency Integration [57.14745782076976]
マルチ露光画像融合は、異なる露光で画像を統合することにより、単一の高ダイナミック画像を生成することを目的としている。
本稿では,MEF-SFI と呼ばれる空間周波数統合フレームワークによるマルチ露光画像融合の新たな視点を提案する。
提案手法は,最先端のマルチ露光画像融合手法に対する視覚的近似核融合結果を実現する。
論文 参考訳(メタデータ) (2023-12-17T04:45:15Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Residual Spatial Fusion Network for RGB-Thermal Semantic Segmentation [19.41334573257174]
従来の方法では、主にRGBイメージを使用し、照明条件、例えば暗闇の影響が大きい。
近年の研究では、セグメンテーションの補正モダリティとして、熱画像は夜のシナリオに頑健であることが示されている。
本稿では,RGB-TセマンティックセグメンテーションのためのResidual Spatial Fusion Network (RSFNet)を提案する。
論文 参考訳(メタデータ) (2023-06-17T14:28:08Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z) - Transformer-based Network for RGB-D Saliency Detection [82.6665619584628]
RGB-Dサリエンシ検出の鍵は、2つのモードにわたる複数のスケールで情報を完全なマイニングとヒューズすることである。
コンバータは機能融合と機能拡張の両面において高い有効性を示す一様操作であることを示す。
提案するネットワークは,最先端のRGB-D値検出手法に対して良好に動作する。
論文 参考訳(メタデータ) (2021-12-01T15:53:58Z) - Dual-Octave Convolution for Accelerated Parallel MR Image Reconstruction [75.35200719645283]
本稿では,実物と虚構の両方から,多次元空間周波数特徴を学習可能なDual-Octave Convolution(Dual-OctConv)を提案する。
オクターブ畳み込みによる複雑な操作を改質することで、MR画像のよりリッチな表現を捉える強力な能力を示す。
論文 参考訳(メタデータ) (2021-04-12T10:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。