論文の概要: FlexiMo: A Flexible Remote Sensing Foundation Model
- arxiv url: http://arxiv.org/abs/2503.23844v1
- Date: Mon, 31 Mar 2025 08:46:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 19:35:57.318426
- Title: FlexiMo: A Flexible Remote Sensing Foundation Model
- Title(参考訳): FlexiMo: フレキシブルなリモートセンシング基盤モデル
- Authors: Xuyang Li, Chenyu Li, Pedram Ghamisi, Danfeng Hong,
- Abstract要約: FlexiMoはフレキシブルなリモートセンシング基盤モデルであり、任意の空間解像度に対応する柔軟性を備えた事前訓練されたモデルを提供する。
Central to FlexiMoは空間分解能を意識したモジュールで、パラメータフリーアライメントの埋め込み機構を採用している。
多様なマルチモーダル、マルチレゾリューション、マルチスケールデータセットの実験により、FlexiMoはモデルの一般化とロバスト性を大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 33.027094254412056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid expansion of multi-source satellite imagery drives innovation in Earth observation, opening unprecedented opportunities for Remote Sensing Foundation Models to harness diverse data. However, many existing models remain constrained by fixed spatial resolutions and patch sizes, limiting their ability to fully exploit the heterogeneous spatial characteristics inherent in satellite imagery. To address these challenges, we propose FlexiMo, a flexible remote sensing foundation model that endows the pre-trained model with the flexibility to adapt to arbitrary spatial resolutions. Central to FlexiMo is a spatial resolution-aware module that employs a parameter-free alignment embedding mechanism to dynamically recalibrate patch embeddings based on the input image's resolution and dimensions. This design not only preserves critical token characteristics and ensures multi-scale feature fidelity but also enables efficient feature extraction without requiring modifications to the underlying network architecture. In addition, FlexiMo incorporates a lightweight channel adaptation module that leverages prior spectral information from sensors. This mechanism allows the model to process images with varying numbers of channels while maintaining the data's intrinsic physical properties. Extensive experiments on diverse multimodal, multi-resolution, and multi-scale datasets demonstrate that FlexiMo significantly enhances model generalization and robustness. In particular, our method achieves outstanding performance across a range of downstream tasks, including scene classification, land cover classification, urban building segmentation, and cloud detection. By enabling parameter-efficient and physically consistent adaptation, FlexiMo paves the way for more adaptable and effective foundation models in real-world remote sensing applications.
- Abstract(参考訳): マルチソース衛星画像の急速な拡大により地球観測の革新が加速し、リモートセンシング財団モデルが多様なデータを活用する前例のない機会が開かれた。
しかし、多くの既存のモデルは固定された空間解像度とパッチサイズによって制約され続けており、衛星画像に固有の不均一な空間特性を完全に活用する能力は制限されている。
これらの課題に対処するために、任意の空間解像度に対応する柔軟性を備えた事前学習モデルを提供するフレキシブルリモートセンシング基盤モデルFlexiMoを提案する。
Central to FlexiMoは空間分解能を意識したモジュールで、パラメータフリーアライメント埋め込み機構を使用して、入力画像の解像度と寸法に基づいてパッチ埋め込みを動的に再分類する。
この設計は重要なトークンの特徴を保ち、マルチスケールの特徴の忠実さを確保するだけでなく、基盤となるネットワークアーキテクチャの変更を必要とせずに効率的な特徴抽出を可能にする。
さらにFlexiMoには、センサーからの事前のスペクトル情報を活用する軽量なチャネル適応モジュールが組み込まれている。
このメカニズムにより、データ固有の物理特性を維持しながら、様々な数のチャネルで画像を処理できる。
多様なマルチモーダル、マルチレゾリューション、マルチスケールデータセットに関する大規模な実験により、FlexiMoはモデルの一般化とロバスト性を大幅に向上させることが示された。
特に,本手法は,シーン分類,土地被覆分類,都市建物のセグメント化,クラウド検出など,下流タスクにおける優れた性能を実現している。
FlexiMoはパラメータ効率と物理的に一貫した適応を可能にすることで、現実世界のリモートセンシングアプリケーションにおいてより適応的で効果的な基礎モデルを実現する。
関連論文リスト
- A class of modular and flexible covariate-based covariance functions for nonstationary spatial modeling [0.0]
固定された観測可能な空間情報に依存する共分散関数のクラスを示す。
このモデルは、辺標準偏差、幾何学的異方性、滑らかさなど、異なる非定常性源に対する別々の構造を可能にする。
シミュレーション研究を通じて提示されたモデルの性能解析とスイスの降水データへの適用について述べる。
論文 参考訳(メタデータ) (2024-10-22T05:53:25Z) - X-Fi: A Modality-Invariant Foundation Model for Multimodal Human Sensing [14.549639729808717]
現在の人間の感覚は主にカメラとLiDARに依存しており、それぞれに独自の強度と限界がある。
既存のマルチモーダル・フュージョン・ソリューションは、一般に固定されたモダリティの組み合わせのために設計されている。
この問題に対処するために、すべてのモダリティ(X-Fi)に対するモダリティ不変基盤モデルを提案する。
論文 参考訳(メタデータ) (2024-10-14T05:23:12Z) - Motion-Oriented Compositional Neural Radiance Fields for Monocular Dynamic Human Modeling [10.914612535745789]
本稿では,MoCo-NeRF(MoCo-NeRF)について述べる。
MoCo-NeRFはモノクロビデオのフリービューポイントレンダリングを実現するために設計されたフレームワークである。
論文 参考訳(メタデータ) (2024-07-16T17:59:01Z) - Gear-NeRF: Free-Viewpoint Rendering and Tracking with Motion-aware Spatio-Temporal Sampling [70.34875558830241]
本研究では,シーンをレンダリングする動的領域の階層化モデリングを可能にする意味的セマンティックギアに基づく,時間的(4D)埋め込みの学習方法を提案する。
同時に、ほぼ無償で、当社のトラッキングアプローチは、既存のNeRFベースのメソッドでまだ達成されていない機能である、自由視点(free-view of interest)を可能にします。
論文 参考訳(メタデータ) (2024-06-06T03:37:39Z) - SuDA: Support-based Domain Adaptation for Sim2Real Motion Capture with Flexible Sensors [12.811669078348489]
既存の柔軟なセンサーベースのMoCapメソッドはディープラーニングに依存しており、トレーニングには大規模で多様なラベル付きデータセットを必要とする。
フレキシブルセンサの高線形性により,ドメイン適応に基づく新しいSim2Real Mocapソリューションを提案する。
我々のソリューションは、新しいサポートベースのドメイン適応法、すなわち、予測関数の支持を整列するSuDAに依存している。
論文 参考訳(メタデータ) (2024-05-25T09:43:33Z) - RSDehamba: Lightweight Vision Mamba for Remote Sensing Satellite Image Dehazing [19.89130165954241]
リモートセンシング画像デハージング(RSID)は、高品質な画像復元のための不均一かつ物理的に不規則なヘイズ要素を取り除くことを目的としている。
本稿では,RSID分野におけるRSDhambaと呼ばれるマンバモデル上での最初の軽量ネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T12:12:07Z) - Learning Modulated Transformation in GANs [69.95217723100413]
生成逆数ネットワーク(GAN)のジェネレータに、変調変換モジュール(Modulated transformation module, MTM)と呼ばれるプラグアンドプレイモジュールを装備する。
MTMは、可変位置で畳み込み操作を適用可能な潜在符号の制御下で空間オフセットを予測する。
挑戦的なTaiChiデータセット上での人為的な生成に向けて、StyleGAN3のFIDを21.36から13.60に改善し、変調幾何変換の学習の有効性を実証した。
論文 参考訳(メタデータ) (2023-08-29T17:51:22Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - SlimSeg: Slimmable Semantic Segmentation with Boundary Supervision [54.16430358203348]
本稿では,単純なスリム化可能なセマンティックセマンティックセマンティクス(SlimSeg)法を提案する。
提案するSlimSegは,様々な主流ネットワークを用いて,計算コストの動的調整と性能向上を実現するフレキシブルなモデルを生成することができることを示す。
論文 参考訳(メタデータ) (2022-07-13T14:41:05Z) - MoDi: Unconditional Motion Synthesis from Diverse Data [51.676055380546494]
多様な動きを合成する無条件生成モデルであるMoDiを提案する。
我々のモデルは、多様な、構造化されていない、ラベルなしのモーションデータセットから完全に教師なしの設定で訓練されている。
データセットに構造が欠けているにもかかわらず、潜在空間は意味的にクラスタ化可能であることを示す。
論文 参考訳(メタデータ) (2022-06-16T09:06:25Z) - Learning High-Dimensional Distributions with Latent Neural Fokker-Planck
Kernels [67.81799703916563]
低次元潜在空間におけるフォッカー・プランク方程式の解法として問題を定式化する新しい手法を導入する。
提案モデルでは,潜在分散モーフィング,ジェネレータ,パラメータ化Fokker-Planckカーネル関数からなる。
論文 参考訳(メタデータ) (2021-05-10T17:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。