論文の概要: WaveMAE: Wavelet decomposition Masked Auto-Encoder for Remote Sensing
- arxiv url: http://arxiv.org/abs/2510.22697v1
- Date: Sun, 26 Oct 2025 14:45:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.332071
- Title: WaveMAE: Wavelet decomposition Masked Auto-Encoder for Remote Sensing
- Title(参考訳): WaveMAE: リモートセンシングのためのウェーブレット分解マスク付きオートエンコーダ
- Authors: Vittorio Bernuzzi, Leonardo Rossi, Tomaso Fontanini, Massimo Bertozzi, Andrea Prati,
- Abstract要約: WaveMAEはマルチスペクトル衛星画像に適したマスク付き自動符号化フレームワークである。
評価の公平性を確保するため、全ての手法が同じデータセット上で事前訓練される(fMoW-S2)。
WaveMAEは従来の最先端アプローチよりも一貫した改善を実現している。
- 参考スコア(独自算出の注目度): 5.65492058135409
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning (SSL) has recently emerged as a key strategy for building foundation models in remote sensing, where the scarcity of annotated data limits the applicability of fully supervised approaches. In this work, we introduce WaveMAE, a masked autoencoding framework tailored for multispectral satellite imagery. Unlike conventional pixel-based reconstruction, WaveMAE leverages a multi-level Discrete Wavelet Transform (DWT) to disentangle frequency components and guide the encoder toward learning scale-aware high-frequency representations. We further propose a Geo-conditioned Positional Encoding (GPE), which incorporates geographical priors via Spherical Harmonics, encouraging embeddings that respect both semantic and geospatial structure. To ensure fairness in evaluation, all methods are pretrained on the same dataset (fMoW-S2) and systematically evaluated on the diverse downstream tasks of the PANGAEA benchmark, spanning semantic segmentation, regression, change detection, and multilabel classification. Extensive experiments demonstrate that WaveMAE achieves consistent improvements over prior state-of-the-art approaches, with substantial gains on segmentation and regression benchmarks. The effectiveness of WaveMAE pretraining is further demonstrated by showing that even a lightweight variant, containing only 26.4% of the parameters, achieves state-of-the-art performance. Our results establish WaveMAE as a strong and geographically informed foundation model for multispectral remote sensing imagery.
- Abstract(参考訳): 自己教師付き学習(SSL)は、リモートセンシングにおいて基礎モデルを構築するための重要な戦略として最近登場し、注釈付きデータの不足が完全に教師付きアプローチの適用性を制限している。
本稿では,マルチスペクトル衛星画像に適したマスク付き自動符号化フレームワークであるWaveMAEを紹介する。
従来の画素ベースの再構成とは異なり、WaveMAEはマルチレベル離散ウェーブレット変換(DWT)を利用して周波数成分をアンタングルし、エンコーダをスケール対応の高周波表現へと導く。
さらに、球高調波による地理的先行情報を組み込んだジオコンディショニング・ポジショナル・エンコーディング(GPE)を提案し、セマンティック構造と地理空間構造の両方を尊重する埋め込みを奨励する。
評価の公平性を確保するため、すべてのメソッドを同じデータセット(fMoW-S2)で事前トレーニングし、PANGAEAベンチマークのさまざまな下流タスク、セマンティックセグメンテーション、回帰、変更検出、マルチラベル分類を体系的に評価する。
大規模な実験により、WaveMAEは従来の最先端アプローチよりも一貫した改善を達成し、セグメンテーションと回帰のベンチマークで大幅に向上した。
WaveMAEプリトレーニングの有効性は、パラメータの26.4%しか含まない軽量な変種でさえ、最先端のパフォーマンスを実現することを示し、さらに実証されている。
この結果から、WaveMAEはマルチスペクトルリモートセンシング画像のための、強力かつ地理的に情報を得た基礎モデルとして確立された。
関連論文リスト
- WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition [61.3530659856013]
本稿では,空間およびウェーブレット領域の機能改善を共同で最適化する新しいデコーダアーキテクチャであるWaveSegを提案する。
高周波成分は、まず入力画像から、境界の詳細を強化するために明示的な先行として学習される。
標準ベンチマークの実験では、Mambaベースの注目に先立ってウェーブレット-ドメイン周波数を利用するWaveSegが、常に最先端のアプローチより優れていることが示されている。
論文 参考訳(メタデータ) (2025-10-24T01:41:31Z) - MARS: Audio Generation via Multi-Channel Autoregression on Spectrograms [0.8258451067861929]
スペクトログラムをマルチチャネル画像として扱うフレームワークであるMARS(Multi-channel AutoRegression on Spectrograms)を紹介する。
共有トークン化器はスケールをまたいだ一貫した離散表現を提供し、トランスフォーマーベースのオートレグレッシャが分光図を効率的に精査することを可能にする。
論文 参考訳(メタデータ) (2025-09-30T09:38:02Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - Generalizable Multispectral Land Cover Classification via Frequency-Aware Mixture of Low-Rank Token Experts [22.75047167955269]
マルチスペクトル土地被覆分類(MLCC)の新しいアプローチであるLand-MoEを紹介する。
Land-MoEは、低ランクトークンエキスパート(MoLTE)と周波数認識フィルタ(FAF)の2つの重要なモジュールから構成される。
論文 参考訳(メタデータ) (2025-05-20T08:52:28Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - Wavelet Dynamic Selection Network for Inertial Sensor Signal Enhancement [11.793803540713695]
慣性センサーは様々な携帯機器で広く使われている。
ウェーブレット動的選択ネットワーク(WDSNet)は、可変慣性信号に対する適切なウェーブレット基底をインテリジェントに選択する。
WDSNetは、弱教師付き手法として、比較された全教師付き手法の最先端性能を達成する。
論文 参考訳(メタデータ) (2023-12-29T07:44:06Z) - Machine learning for phase-resolved reconstruction of nonlinear ocean
wave surface elevations from sparse remote sensing data [37.69303106863453]
ニューラルネットワークを用いた位相分解波面再構成のための新しい手法を提案する。
提案手法は,一次元格子を用いた合成的かつ高精度な訓練データを利用する。
論文 参考訳(メタデータ) (2023-05-18T12:30:26Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。