Fugu-MT 論文翻訳(概要): Emerging Flexible Designs for Geospatial Multimodal Foundation Models

論文の概要: Emerging Flexible Designs for Geospatial Multimodal Foundation Models

arxiv url: http://arxiv.org/abs/2606.12595v1
Date: Wed, 10 Jun 2026 18:46:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.413219
Title: Emerging Flexible Designs for Geospatial Multimodal Foundation Models
Title（参考訳）: 地理空間的マルチモーダル基礎モデルのためのフレキシブル設計
Authors: Philipe Dias, Waqwoya Abebe, Abhishek Potnis, Aristeidis Tsaris, Dan Lu, Xiao Wang, Dalton Lunga,
Abstract要約: 本稿では,地理空間的マルチモーダル推論のために設計されたFMアーキテクチャのアプライアンス・アプライアンス比較について述べる。我々の結果は、モデル柔軟性、モダリティアライメント、下流タスクパフォーマンスの間の設計上のトレードオフに関する新たな洞察を提供する。
参考スコア（独自算出の注目度）: 3.8796946939616093
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Foundation models are rapidly transforming Earth observation by enabling scalable pretraining across diverse unlabeled geospatial modalities. However, their architectural diversity ranging from encoder-only to encoder-decoder and masked autoencoding paradigms makes it challenging to assess performance trade offs in a consistent manner. In this work, we present an apples-to-apples comparison of leading FM architectures designed for geospatial multimodal reasoning, with a particular focus on flexibility across varied spectral band configurations. We standardize pretraining using identical self supervised learning objectives and training datasets, and evaluate all models under consistent parameterization on the GEOBench benchmark across classification and segmentation tasks. Our results offer new insights into the design trade-offs between model flexibility, modality alignment, and downstream task performance. By highlighting architectural strengths and limitations under controlled conditions, this study provides practical guidance for building next generation geospatial foundation models capable of robust multimodal reasoning.
Abstract（参考訳）: 基礎モデルは、多様な未ラベルの地理空間の様相にまたがるスケーラブルな事前訓練を可能にすることで、地球観測を急速に変革している。しかしながら、エンコーダのみからエンコーダ-デコーダ、マスク付き自動エンコードパラダイムまで、アーキテクチャの多様性は、一貫した方法でパフォーマンストレードオフを評価することを困難にしている。本研究では,空間的マルチモーダル推論のために設計された主要なFMアーキテクチャのアプライアンスとアプライアンスを比較し,様々なスペクトル帯域構成の柔軟性に着目した。我々は,同一の自己教師型学習目標と訓練データセットを用いて事前学習を標準化し,GEOBenchベンチマークにおける一貫したパラメータ化に基づく全モデルの評価を行った。我々の結果は、モデル柔軟性、モダリティアライメント、下流タスクパフォーマンスの間の設計上のトレードオフに関する新たな洞察を提供する。本研究は, 制御条件下での建築的強みと限界を強調することにより, 頑健なマルチモーダル推論が可能な次世代地理空間基盤モデルを構築するための実践的ガイダンスを提供する。

関連論文リスト

OFA-MAS: One-for-All Multi-Agent System Topology Design based on Mixture-of-Experts Graph Generative Models [57.94189874119267]
マルチエージェントシステム(MAS)は複雑な問題を解決するための強力なパラダイムを提供する。現在のグラフ学習に基づく設計手法は、しばしば「1対1」のパラダイムに準拠している。自然言語で記述されたタスクに対して適応的な協調グラフを生成する一対一のフレームワークOFA-TADを提案する。
論文参考訳（メタデータ） (2026-01-19T12:23:44Z)
An Integrated Fusion Framework for Ensemble Learning Leveraging Gradient Boosting and Fuzzy Rule-Based Models [59.13182819190547]
ファジィ規則に基づくモデルは解釈可能性に優れ、様々な分野に広く応用されている。複雑な設計仕様や大規模データセットのスケーラビリティといった課題に直面している。本稿では,モデル性能と解釈可能性を高めるために,両パラダイムの強みを融合した統合統合フレームワークを提案する。
論文参考訳（メタデータ） (2025-11-11T10:28:23Z)
SITS-DECO: A Generative Decoder Is All You Need For Multitask Satellite Image Time Series Modelling [0.0]
本稿では,EOデータに統一シーケンスフレーミングを適用する概念実証モデルであるSITS-DECOを紹介する。モデルが単一統一アーキテクチャ内で複数の教師付きタスクや自己監督型タスクを実行できることを示す。単純さと空間的文脈の欠如にもかかわらず、SITS-DECOは作物型分類におけるより大きなEO基盤モデルよりも優れている。
論文参考訳（メタデータ） (2025-10-21T14:42:55Z)
PracMHBench: Re-evaluating Model-Heterogeneous Federated Learning Based on Practical Edge Device Constraints [10.472945501141664]
エッジデバイス上で多様なリソース制約を持つ異種モデルをフェデレーションすることは、近年顕著なトレンドとなっている。我々は、エッジデバイスの実用的制約に基づいてモデル不均一FLを評価するために、最初のシステムプラットフォーム textbfPracMHBench を構築した。
論文参考訳（メタデータ） (2025-09-04T08:19:56Z)
UNO: Unified Self-Supervised Monocular Odometry for Platform-Agnostic Deployment [22.92093036869778]
多様な環境にまたがるロバストかつ姿勢推定を可能にする統合ビジュアル・オドメトリー・フレームワークであるUNOを提案する。われわれのアプローチは、自動運転車、ドローン、移動ロボット、ハンドヘルドデバイスなど、さまざまな現実のシナリオを効果的に一般化する。提案手法を3つの主要なベンチマークデータセット上で広範囲に評価する。
論文参考訳（メタデータ） (2025-06-08T06:30:37Z)
UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines [64.84631333071728]
本稿では,時間的モデリングのためのトランスフォーマーベースの統合フレームワークであるbfUnistageを紹介する。我々の研究は、タスク固有の視覚テキストが時間学習のための一般化可能なモデルを構築することができることを示した。また、時間的ダイナミクスを明示的に組み込むための時間的モジュールも導入する。
論文参考訳（メタデータ） (2025-03-26T17:33:23Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。 Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文参考訳（メタデータ） (2020-06-15T22:22:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。