論文の概要: FLORO: A Multimodal Geospatial Foundation Model for Ecological Remote Sensing Across Sensors and Scales
- arxiv url: http://arxiv.org/abs/2605.28174v1
- Date: Wed, 27 May 2026 08:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.913386
- Title: FLORO: A Multimodal Geospatial Foundation Model for Ecological Remote Sensing Across Sensors and Scales
- Title(参考訳): FLORO: センサとスケール間の環境リモートセンシングのためのマルチモーダル地球空間基盤モデル
- Authors: Jorge L. Rodriguez, Victor Angulo Morales, Areej Alwahas, Mariana Elias Lara, Fida Mohammad Thoker, Kasper Johansen, Bernard Ghanem, Fernando T. Maestre, Matthew F. McCabe,
- Abstract要約: FLOROは、小さなが高度に多様なリモートセンシングコーパスから転送可能な表現を学習するために設計されたマルチモーダル基礎モデルである。
FLOROは、Sentinel-1、Sentinel-2、SkySAT画像、標高、UAV由来のデータとの不均一な組み合わせによるマスク付きオートエンコーディングを用いて事前訓練される。
我々は、シーン分類、セグメンテーション、回帰タスクにまたがる凍結エンコーダプロトコルを用いて、PANGAEAベンチマーク上でFLOROを評価した。
- 参考スコア(独自算出の注目度): 65.4821703903285
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foundation models offer a promising route to transferable remote sensing representations, but many current approaches depend on very large pretraining datasets and fixed sensor configurations, limiting their suitability for ecological and environmental applications, where observations often vary across platforms, spatial and spectral resolutions, and available modalities. We introduce FLORO, a multimodal geospatial foundation model designed to learn transferable representations from a small but highly diverse remote sensing corpus. FLORO is pretrained using masked autoencoding on a heterogeneous combination of Sentinel-1, Sentinel-2, SkySAT imagery, elevation, and UAV-derived data. To accommodate sensor variability, FLORO incorporates availability-aware inputs that indicate which spectral bands and auxiliary modalities are present in each sample, enabling a unified input space across heterogeneous sensor configurations. We evaluated FLORO on the PANGAEA benchmark under a frozen-encoder protocol across scene classification, segmentation, and regression tasks. Despite being pretrained on a smaller corpus than competing foundation models, FLORO achieved strong and stable transfer across optical, optical-SAR, and optical-elevation benchmarks spanning medium-resolution satellite, airborne, and ultra-high-resolution UAV imagery. FLORO obtained the second-best average segmentation performance across six PANGAEA benchmarks, trailing only a recently introduced foundation model pretrained on over two orders of magnitude more images, remained competitive on scene classification, and was robust in regression tasks, while qualitative results showed improved preservation of spatial structure in flood, urban, biomass, and canopy-height prediction settings. In a separate controlled experiment on EuroSAT-MS, geo-positional encoding further improved classification relative to absolute positional encoding.
- Abstract(参考訳): ファンデーションモデルは、転送可能なリモートセンシング表現への有望なルートを提供するが、現在の多くのアプローチは、非常に大きな事前訓練データセットと固定されたセンサー構成に依存し、環境や環境の応用に適合する可能性を制限する。
小型ながら多様なリモートセンシングコーパスから転送可能な表現を学習するためのマルチモーダルな地理空間基盤モデルであるFLOROを導入する。
FLOROは、Sentinel-1、Sentinel-2、SkySAT画像、標高、UAV由来のデータとの不均一な組み合わせによるマスク付きオートエンコーディングを用いて事前訓練される。
センサの可変性に対応するため、FLOROは各サンプルにどのスペクトル帯域と補助モードが存在するかを示すアベイラビリティ対応入力を導入し、不均一なセンサ構成で統一された入力空間を実現する。
我々は、シーン分類、セグメンテーション、回帰タスクにまたがる凍結エンコーダプロトコルを用いて、PANGAEAベンチマーク上でFLOROを評価した。
競合する基礎モデルよりも小型のコーパスで事前訓練を受けたにもかかわらず、FLOROは高解像度の衛星、空中、超高解像度のUAV画像にまたがる光学、光学SAR、光学標高のベンチマークをまたいで、強力で安定した転送を実現した。
FLOROは6つのPANGAEAベンチマークで2番目に高いセグメンテーション性能を達成し、最近導入された2桁以上の画像に基づいて事前訓練された基礎モデルのみを踏襲し、シーン分類に競争力を持ち、レグレッションタスクに頑健であり、定性的な結果は洪水、都市、バイオマス、天蓋高さ予測設定における空間構造の保存性の改善を示した。
EuroSAT-MSの別個の制御実験では、位置エンコーディングは絶対的な位置エンコーディングに対する分類をさらに改善した。
関連論文リスト
- OmniLiDAR: A Unified Diffusion Framework for Multi-Domain 3D LiDAR Generation [100.36917520403227]
本稿では,8つの代表領域にまたがる共有範囲画像表現において,LiDARスキャンを生成する統一テキスト条件拡散フレームワークを提案する。
パブリックな統合ベンチマークがなければ、実世界のスキャンと物理ベース気象シミュレーションとシステマティックビームリダクションを組み合わせた8ドメインデータセットを構築する。
論文 参考訳(メタデータ) (2026-05-13T17:42:20Z) - Multi-Modal Landslide Detection from Sentinel-1 SAR and Sentinel-2 Optical Imagery Using Multi-Encoder Vision Transformers and Ensemble Learning [0.0]
地すべりは、人間の生活、インフラ、生態系に深刻な影響を与えている主要なジオハザードである。
本研究では、Sentinel-1 Synthetic Aperture Radar(SAR)データとSentinel-2光画像を融合したモジュラー・マルチモデルフレームワークを提案する。
提案手法は地すべり検出における最先端F1スコア0.919を達成する。
論文 参考訳(メタデータ) (2026-04-07T14:51:05Z) - Enhancing Gradient Inversion Attacks in Federated Learning via Hierarchical Feature Optimization [56.95448807869383]
フェデレートラーニング(FL)は、プライバシを保存する分散機械学習の魅力的なパラダイムとして登場した。
近年の研究では、FLシステムで交換される勾配もプライバシー漏洩に弱いことが報告されている。
我々は textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD) を提案する。
論文 参考訳(メタデータ) (2026-04-01T14:32:15Z) - Context-Aware Multimodal Representation Learning for Spatio-Temporally Explicit Environmental Modelling [3.3984815208531014]
本稿では,高時間分解能で異なるモダリティを統一空間に統合する表現学習フレームワークを提案する。
提案手法は,クラウドフリーのSentinel-2データの時間周波数と10mのネイティブ解像度で遅延空間を生成する。
これにより、モデルが補完的なリモートセンシングデータをキャプチャし、空間と時間のコヒーレンスを保存することができる。
論文 参考訳(メタデータ) (2025-11-12T15:34:17Z) - WaveMAE: Wavelet decomposition Masked Auto-Encoder for Remote Sensing [5.65492058135409]
WaveMAEはマルチスペクトル衛星画像に適したマスク付き自動符号化フレームワークである。
評価の公平性を確保するため、全ての手法が同じデータセット上で事前訓練される(fMoW-S2)。
WaveMAEは従来の最先端アプローチよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2025-10-26T14:45:30Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。