論文の概要: Generalizable Multispectral Land Cover Classification via Frequency-Aware Mixture of Low-Rank Token Experts
- arxiv url: http://arxiv.org/abs/2505.14088v1
- Date: Tue, 20 May 2025 08:52:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.946004
- Title: Generalizable Multispectral Land Cover Classification via Frequency-Aware Mixture of Low-Rank Token Experts
- Title(参考訳): 低域トークンエキスパートの周波数・認識混合による一般化可能なマルチスペクトル土地被覆分類
- Authors: Xi Chen, Shen Yan, Juelin Zhu, Chen Chen, Yu Liu, Maojun Zhang,
- Abstract要約: マルチスペクトル土地被覆分類(MLCC)の新しいアプローチであるLand-MoEを紹介する。
Land-MoEは、低ランクトークンエキスパート(MoLTE)と周波数認識フィルタ(FAF)の2つの重要なモジュールから構成される。
- 参考スコア(独自算出の注目度): 22.75047167955269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Land-MoE, a novel approach for multispectral land cover classification (MLCC). Spectral shift, which emerges from disparities in sensors and geospatial conditions, poses a significant challenge in this domain. Existing methods predominantly rely on domain adaptation and generalization strategies, often utilizing small-scale models that exhibit limited performance. In contrast, Land-MoE addresses these issues by hierarchically inserting a Frequency-aware Mixture of Low-rank Token Experts, to fine-tune Vision Foundation Models (VFMs) in a parameter-efficient manner. Specifically, Land-MoE comprises two key modules: the mixture of low-rank token experts (MoLTE) and frequency-aware filters (FAF). MoLTE leverages rank-differentiated tokens to generate diverse feature adjustments for individual instances within multispectral images. By dynamically combining learnable low-rank token experts of varying ranks, it enhances the robustness against spectral shifts. Meanwhile, FAF conducts frequency-domain modulation on the refined features. This process enables the model to effectively capture frequency band information that is strongly correlated with semantic essence, while simultaneously suppressing frequency noise irrelevant to the task. Comprehensive experiments on MLCC tasks involving cross-sensor and cross-geospatial setups demonstrate that Land-MoE outperforms existing methods by a large margin. Additionally, the proposed approach has also achieved state-of-the-art performance in domain generalization semantic segmentation tasks of RGB remote sensing images.
- Abstract(参考訳): マルチスペクトル土地被覆分類(MLCC)の新しいアプローチであるLand-MoEを紹介する。
センサーと地理空間条件の相違から生じるスペクトルシフトは、この領域で大きな課題となる。
既存の手法は主にドメイン適応と一般化戦略に依存しており、しばしば限られた性能を示す小規模なモデルを利用する。
対照的に、Land-MoEは、低ランクのトークンエキスパートの周波数認識混合体をパラメータ効率で微調整ビジョン基礎モデル(VFM)に階層的に挿入することで、これらの問題に対処する。
具体的には、Land-MoEは、低ランクトークンエキスパート(MoLTE)と周波数認識フィルタ(FAF)の2つの重要なモジュールから構成される。
MoLTEはランク微分トークンを利用して、マルチスペクトル画像内の個々のインスタンスの多様な特徴調整を生成する。
様々なランクの学習可能な低ランクトークン専門家を動的に組み合わせることで、スペクトルシフトに対する堅牢性を高める。
一方、AFFは改良された特徴に対して周波数領域変調を行う。
このプロセスにより、タスクに関係のない周波数ノイズを同時に抑制しつつ、意味の本質と強く相関する周波数帯域情報を効果的に捕捉することができる。
クロスセンサと地理空間のセットアップを含むMLCCタスクに関する総合的な実験は、Land-MoEが既存の手法よりも大きなマージンで優れていることを示した。
さらに,提案手法は,RGBリモートセンシング画像の領域一般化セマンティックセグメンテーションタスクにおいて,最先端のパフォーマンスも達成している。
関連論文リスト
- FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning [35.40065954148091]
ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-13T08:48:06Z) - Dual-Domain Masked Image Modeling: A Self-Supervised Pretraining Strategy Using Spatial and Frequency Domain Masking for Hyperspectral Data [35.34526230299484]
本稿では,ラベルなしデータの大部分を利用するハイパースペクトルデータに対する自己教師付き事前学習戦略を提案する。
本稿では,空間領域と周波数領域の両方で動作する新しい二重ドメインマスキング機構を提案する。
提案手法を3つの公開HSI分類ベンチマークで評価し,現状の性能を実証した。
論文 参考訳(メタデータ) (2025-05-06T06:24:21Z) - Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。
本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。
我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文 参考訳(メタデータ) (2024-09-03T07:58:47Z) - Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.87635234206178]
本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。
このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文 参考訳(メタデータ) (2024-08-05T08:35:59Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。
MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。
MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文 参考訳(メタデータ) (2022-06-15T17:58:30Z) - Few-shot One-class Domain Adaptation Based on Frequency for Iris
Presentation Attack Detection [33.41823375502942]
アイリス提示攻撃検知(PAD)はアイリス認識システムの信頼性と安全性を確保するために大きな成功を収めた。
既存の手法のほとんどは、空間領域における識別的特徴を利用して、データセット内設定下での優れた性能を報告している。
Few-shot One-class Domain Adaptation (FODA) と呼ばれる新しいドメイン適応方式を提案する。
論文 参考訳(メタデータ) (2022-04-01T11:55:06Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。