論文の概要: GeoSANE: Learning Geospatial Representations from Models, Not Data
- arxiv url: http://arxiv.org/abs/2603.23408v1
- Date: Tue, 24 Mar 2026 16:40:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.590306
- Title: GeoSANE: Learning Geospatial Representations from Models, Not Data
- Title(参考訳): GeoSANE: データではなくモデルから地理空間表現を学ぶ
- Authors: Joelle Hanna, Damian Falk, Stella X. Yu, Damian Borth,
- Abstract要約: 既存の基礎モデルとタスク固有モデルの重みから統一されたニューラル表現を学習するモデルファウンダリーであるGeoSANEを紹介する。
ターゲットアーキテクチャが与えられた場合、GeoSANEは複数のモードにわたる分類、セグメンテーション、検出タスクの微調整が可能な重みを生成する。
GeoSANEによって生成されたモデルは、スクラッチからトレーニングされたモデル、最先端のリモートセンシング基盤モデル、プルーニングや知識蒸留によって得られたモデルより一貫して優れています。
- 参考スコア(独自算出の注目度): 28.614607015802303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in remote sensing have led to an increase in the number of available foundation models; each trained on different modalities, datasets, and objectives, yet capturing only part of the vast geospatial knowledge landscape. While these models show strong results within their respective domains, their capabilities remain complementary rather than unified. Therefore, instead of choosing one model over another, we aim to combine their strengths into a single shared representation. We introduce GeoSANE, a geospatial model foundry that learns a unified neural representation from the weights of existing foundation models and task-specific models, able to generate novel neural networks weights on-demand. Given a target architecture, GeoSANE generates weights ready for finetuning for classification, segmentation, and detection tasks across multiple modalities. Models generated by GeoSANE consistently outperform their counterparts trained from scratch, match or surpass state-of-the-art remote sensing foundation models, and outperform models obtained through pruning or knowledge distillation when generating lightweight networks. Evaluations across ten diverse datasets and on GEO-Bench confirm its strong generalization capabilities. By shifting from pre-training to weight generation, GeoSANE introduces a new framework for unifying and transferring geospatial knowledge across models and tasks. Code is available at \href{https://hsg-aiml.github.io/GeoSANE/}{hsg-aiml.github.io/GeoSANE/}.
- Abstract(参考訳): リモートセンシングの最近の進歩により、利用可能な基礎モデルの数が増加し、それぞれ異なるモダリティ、データセット、目的に基づいて訓練されたが、広大な地理空間の知識ランドスケープの一部しか取得できなかった。
これらのモデルはそれぞれの領域で強い結果を示すが、それらの能力は統一されるよりも相補的なままである。
したがって、一つのモデルを選ぶのではなく、その強みを一つの共有表現に組み合わせることを目指している。
既存の基礎モデルとタスク固有モデルの重みから統一されたニューラルネットワーク表現を学習し、新しいニューラルネットワーク重みをオンデマンドで生成できる地理空間モデルファウントリーであるGeoSANEを紹介する。
ターゲットアーキテクチャが与えられた場合、GeoSANEは複数のモードにわたる分類、セグメンテーション、検出タスクの微調整が可能な重みを生成する。
GeoSANEが生成したモデルは、スクラッチ、マッチ、あるいは最先端のリモートセンシング基盤モデル、軽量ネットワークの生成時にプルーニングや知識蒸留によって得られたモデルより一貫して優れている。
10の多様なデータセットとGEO-Benchに対する評価は、その強力な一般化能力を確認している。
事前トレーニングからウェイトジェネレーションに移行することで、GeoSANEは、モデルとタスクをまたいだ地理空間的知識の統合と転送を行う新しいフレームワークを導入した。
コードは \href{https://hsg-aiml.github.io/GeoSANE/}{hsg-aiml.github.io/GeoSANE/} で公開されている。
関連論文リスト
- GeoTikzBridge: Advancing Multimodal Code Generation for Geometric Perception and Reasoning [68.82147650371216]
GeoTikzBridgeは、Tikzベースのコード生成を通じて局所的な幾何学的知覚と視覚的推論を強化するフレームワークである。
このフレームワーク内では、2つの補完的なデータセットによってサポートされている2つのモデルを構築します。
本モデルは,オープンソースMLLMの最先端性能を実現する。
論文 参考訳(メタデータ) (2026-03-24T01:27:51Z) - GEO-Bench-2: From Performance to Capability, Rethinking Evaluation in Geospatial AI [52.13138825802668]
GeoFMは地球観測を変革しているが、評価には標準化されたプロトコルが欠けている。
GEO-Bench-2は、分類、セグメンテーション、回帰、オブジェクト検出、インスタンスセグメンテーションにまたがる包括的なフレームワークでこの問題に対処する。
GEO-Bench-2のコード、データ、およびリーダーボードは、パーミッシブライセンスの下で公開されている。
論文 参考訳(メタデータ) (2025-11-19T17:45:02Z) - RemoteSAM: Towards Segment Anything for Earth Observation [29.707796048411705]
我々は、地球観測のための頑健でフレキシブルな視覚基盤モデルを開発することを目指している。
多様な視覚的目標を認識し、位置を特定する能力を持つべきである。
いくつかの地球観測知覚ベンチマークで新しいSoTAを確立する基盤モデルであるRemoteSAMを提案する。
論文 参考訳(メタデータ) (2025-05-23T15:27:57Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - GeoAggregator: An Efficient Transformer Model for Geo-Spatial Tabular Data [5.40483645224129]
本稿では地理空間データモデリングのための効率的かつ軽量なアルゴリズムGeoAggregatorを紹介する。
我々は、空間統計モデル、XGBoost、およびいくつかの最先端地理空間深層学習法と比較した。
その結果、GeoAggregatorsは、ほぼすべてのデータセットで競合相手と比較して、ベストまたはセカンドベストのパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-02-20T20:39:15Z) - One Model for One Graph: A New Perspective for Pretraining with Cross-domain Graphs [59.7297608804716]
複雑なネットワークパターンをキャプチャする強力なツールとして、グラフニューラルネットワーク(GNN)が登場した。
既存のGNNには、慎重にドメイン固有のアーキテクチャ設計と、データセットのスクラッチからのトレーニングが必要です。
我々は、新しいクロスドメイン事前学習フレームワーク「1つのグラフのための1つのモデル」を提案する。
論文 参考訳(メタデータ) (2024-11-30T01:49:45Z) - On the Opportunities and Challenges of Foundation Models for Geospatial
Artificial Intelligence [39.86997089245117]
ファンデーションモデル(FM)は、微調整、少数ショット、ゼロショット学習によって、幅広い下流タスクに適応することができる。
我々は,GeoAIのためのFMを開発する上で大きな課題の一つとして,地理空間的タスクのマルチモーダル性に対処することを提案する。
論文 参考訳(メタデータ) (2023-04-13T19:50:17Z) - Towards Geospatial Foundation Models via Continual Pretraining [22.825065739563296]
資源コストと炭素の影響を最小限に抑えた高効率基礎モデルを構築するための新しいパラダイムを提案する。
まず、複数のソースからコンパクトだが多様なデータセットを構築し、GeoPileと呼ぶ特徴の多様性を促進する。
次に,大規模なImageNet-22kモデルからの継続事前学習の可能性について検討し,多目的連続事前学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-09T07:39:02Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Learning Signal-Agnostic Manifolds of Neural Fields [50.066449953522685]
ニューラルネットワークを利用して、画像、形状、オーディオ、およびモーダル・オーディオヴィジュアル領域の基盤となる構造を捉える。
GEMの基底多様体を横切ることで、信号領域に新しいサンプルを生成できることが示される。
論文 参考訳(メタデータ) (2021-11-11T18:57:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。