論文の概要: Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation
- arxiv url: http://arxiv.org/abs/2504.06220v3
- Date: Wed, 16 Apr 2025 17:23:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:36:32.525950
- Title: Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation
- Title(参考訳): 地球適応器:周波数適応の混合による地理空間領域ギャップを橋渡しする
- Authors: Xiaoxing Hu, Ziyang Gong, Yupei Wang, Yuru Jia, Gen Luo, Xue Yang,
- Abstract要約: 本研究では,リモートセンシング(RS)シナリオに特化して設計された最初のPEFT方式であるEarth-Adapterを紹介する。
DFTを利用することで、Earth-Adapterは特徴を異なる周波数成分に分解し、アーティファクトを元の特徴から正確に分離することができる。
ベースラインのReinと比較して、Earth-AdapterはDAで9.0% mIoU、DGベンチマークで3.1% mIoUを大幅に改善している。
- 参考スコア(独自算出の注目度): 7.763004164908855
- License:
- Abstract: Parameter-Efficient Fine-Tuning (PEFT) is a technique that allows us to adapt powerful Foundation Models (FMs) to diverse downstream tasks while preserving and unleashing their inherent capabilities. However, we have observed that existing PEFT methods, which are often designed with natural imagery in mind, struggle when applied to Remote Sensing (RS) scenarios. This is primarily due to their inability to handle artifact influences, a problem particularly severe in RS image features. To tackle this challenge, we introduce Earth-Adapter, the first PEFT method specifically designed for RS artifacts conquering. Earth-Adapter introduces a novel Mixture of Frequency Adaptation process that combines a Mixture of Adapter (MoA) with Discrete Fourier Transformation (DFT). By utilizing DFT, Earth-Adapter can decompose features into different frequency components, precisely separating artifacts from original features. The MoA then dynamically assigns weights to each adapter expert, allowing for the combination of features across various frequency domains. These simple-yet-effective approaches enable Earth-Adapter to more efficiently overcome the disturbances caused by artifacts than previous PEFT methods, significantly enhancing the FMs' performance on RS scenarios. Experiments on Domain Adaptation (DA), and Domain Generalization (DG) semantic segmentation benchmarks showcase the Earth-Adapter's effectiveness. Compared with baseline Rein, Earth-Adapter significantly improves 9.0% mIoU in DA and 3.1% mIoU in DG benchmarks. Our code will be released at https://github.com/VisionXLab/Earth-Adapter.
- Abstract(参考訳): パラメータ効率の良いファインチューニング(PEFT)は、強力なファンデーションモデル(FM)を様々な下流タスクに適応させながら、その固有の能力を保存し、解放することを可能にする技術である。
しかし,自然画像を念頭に置いて設計される既存のPEFT法は,リモートセンシング(RS)のシナリオに適用した場合に困難であることがわかった。
これは主に、アーティファクトの影響に対処できないことによるものであり、特にRS画像の特徴に深刻な問題である。
この課題に対処するために、我々は、RSアーティファクトの征服用に特別に設計された最初のPEFT手法であるEarth-Adapterを紹介した。
Earth-Adapterは、Mixture of Adapter (MoA)とDisdisrete Fourier Transformation (DFT)を組み合わせた新しい周波数適応プロセスを導入する。
DFTを利用することで、Earth-Adapterは特徴を異なる周波数成分に分解し、アーティファクトを元の特徴から正確に分離することができる。
そしてMoAは動的に各アダプタの専門家に重みを割り当て、様々な周波数領域にまたがる機能の組み合わせを可能にする。
これらの単純なyet効果のアプローチにより、アースアダプタは以前のPEFT法よりもアーティファクトによって引き起こされた障害をより効率的に克服し、RSシナリオにおけるFMの性能を大幅に向上させることができる。
ドメイン適応(DA)とドメイン一般化(DG)セマンティックセグメンテーションベンチマークの実験は、アース・アダプタの有効性を示している。
ベースラインのReinと比較して、Earth-AdapterはDAで9.0% mIoU、DGベンチマークで3.1% mIoUを大幅に改善している。
私たちのコードはhttps://github.com/VisionXLab/Earth-Adapter.orgでリリースされます。
関連論文リスト
- iConFormer: Dynamic Parameter-Efficient Tuning with Input-Conditioned Adaptation [15.97351561456467]
本稿では,iConFormerと呼ばれる新しいPEFT手法,入出力トランスフォーマーを提案する。
インスタンスレベルの特徴変換を可能にする動的アダプタに,入出力ネットワーク(iCoN)を導入する。
具体的に言うと、iCoNは各機能に対してチャネルワイドな畳み込みカーネルを生成し、それを適応畳み込みプロセスを使って変換し、下流タスクに適したタスク固有できめ細かな詳細を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-04T16:06:23Z) - Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision [52.80792724919329]
本稿では,2次元画像と3次元点雲の微調整を改善するためのAdapter-Xという新しいフレームワークを提案する。
2D画像と3Dポイントの雲のモードで完全な微調整をし、パラメータが大幅に少ない、すなわち2Dと3Dの分類タスクにおいて、オリジナルのトレーニング可能なパラメータのわずか0.20%と1.88%で、初めて性能を上回った。
論文 参考訳(メタデータ) (2024-06-05T08:26:44Z) - MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.545054873239295]
ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。
ViT法はトランスの表現性を生かし,優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文 参考訳(メタデータ) (2024-04-12T13:02:08Z) - RSAdapter: Adapting Multimodal Models for Remote Sensing Visual Question Answering [11.805761578275627]
本稿では,実行時間とパラメータの効率を優先するRSAdapterという新しい手法を提案する。
RSAdapterの有効性を示すため、3つの異なるRS-VQAデータセットを用いて大規模な実験を行った。
論文 参考訳(メタデータ) (2023-10-19T19:32:27Z) - MerA: Merging Pretrained Adapters For Few-Shot Learning [71.44422347502409]
モデル融合により,事前学習したアダプタを単一モデルに効率的に組み込むことができるtextbftextttMerging Pretrained Adapters (MerA)を提案する。
2つのPLMの実験では、MerAはシングルアダプタとAdapterFusionの両方と比較して大幅に改善されている。
論文 参考訳(メタデータ) (2023-08-30T12:10:17Z) - Mixture-of-Domain-Adapters: Decoupling and Injecting Domain Knowledge to
Pre-trained Language Models Memories [31.995033685838962]
プレトレーニング言語モデル(PLM)は、特定のドメインで苦労しながら、ジェネリックドメインのテキストを理解する優れた能力を示す。
本稿では,数個のパラメータをチューニングするだけで,PLMを効果的かつ効率的に適用できるかどうかを検討する。
具体的には、トランスフォーマーアーキテクチャのフィードフォワードネットワーク(FFN)を、旧ドメインの知識を維持するためにトレーニング済みのFFNと、ドメイン固有の知識を並列に注入するための新しいドメイン固有のアダプタの2つに分割する。
論文 参考訳(メタデータ) (2023-06-08T17:54:36Z) - Parameter-Efficient Sparse Retrievers and Rerankers using Adapters [4.9545244468634655]
本研究では,スパースレトリバーであるSPLADEのアダプタについて検討する。
また、クロスドメインBEIRデータセットとTripClickのアダプタにより、ニューラルネットワークのドメイン適応にも対処する。
論文 参考訳(メタデータ) (2023-03-23T12:34:30Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Decoupled Dynamic Filter Networks [85.38058820176047]
これらの欠点を同時に解決できるDDF(Decoupled Dynamic Filter)を提案します。
最近の注目の高まりに触発されて、DDFは深度ワイドなダイナミックフィルタを空間的およびチャネル的ダイナミックフィルタに分離する。
分類ネットワークにおける標準畳み込みをDFFに置き換える際の性能向上を観察する。
論文 参考訳(メタデータ) (2021-04-29T04:55:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。