論文の概要: InstaGeo: Compute-Efficient Geospatial Machine Learning from Data to Deployment
- arxiv url: http://arxiv.org/abs/2510.05617v1
- Date: Tue, 07 Oct 2025 06:57:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.132929
- Title: InstaGeo: Compute-Efficient Geospatial Machine Learning from Data to Deployment
- Title(参考訳): InstaGeo: データからデプロイまでの効率的な地理空間機械学習
- Authors: Ibrahim Salihu Yusuf, Iffanice Houndayi, Rym Oualha, Mohamed Aziz Cherif, Kobby Panford-Quainoo, Arnu Pretorius,
- Abstract要約: InstaGeoは、生の衛星画像をモデル対応のデータセットに変換するためのオープンソースのフレームワークである。
InstaGeoはどのようにして生画像をモデル対応のデータセットに変換し、コンパクトで計算効率の良いモデルを生成するかを示す。
我々はまた、InstaGeoが研究グレードのGFMを、リアルタイムで大規模な地球観測のための実用的で低炭素のツールに変える方法も示している。
- 参考スコア(独自算出の注目度): 3.6927415209865533
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open-access multispectral imagery from missions like Landsat 8-9 and Sentinel-2 has fueled the development of geospatial foundation models (GFMs) for humanitarian and environmental applications. Yet, their deployment remains limited by (i) the absence of automated geospatial data pipelines and (ii) the large size of fine-tuned models. Existing GFMs lack workflows for processing raw satellite imagery, and downstream adaptations often retain the full complexity of the original encoder. We present InstaGeo, an open-source, end-to-end framework that addresses these challenges by integrating: (1) automated data curation to transform raw imagery into model-ready datasets; (2) task-specific model distillation to derive compact, compute-efficient models; and (3) seamless deployment as interactive web-map applications. Using InstaGeo, we reproduced datasets from three published studies and trained models with marginal mIoU differences of -0.73 pp for flood mapping, -0.20 pp for crop segmentation, and +1.79 pp for desert locust prediction. The distilled models are up to 8x smaller than standard fine-tuned counterparts, reducing FLOPs and CO2 emissions with minimal accuracy loss. Leveraging InstaGeo's streamlined data pipeline, we also curated a larger crop segmentation dataset, achieving a state-of-the-art mIoU of 60.65%, a 12 pp improvement over prior baselines. Moreover, InstaGeo enables users to progress from raw data to model deployment within a single working day. By unifying data preparation, model compression, and deployment, InstaGeo transforms research-grade GFMs into practical, low-carbon tools for real-time, large-scale Earth observation. This approach shifts geospatial AI toward data quality and application-driven innovation. Source code, datasets, and model checkpoints are available at: https://github.com/instadeepai/InstaGeo-E2E-Geospatial-ML.git
- Abstract(参考訳): Landsat 8-9やSentinel-2のようなミッションからのオープンアクセスマルチスペクトル画像は、人道的および環境的応用のための地理空間基盤モデル(GFM)の開発を加速させた。
しかし、その展開は依然として限られている。
一 自動地理空間データパイプラインがないこと。
(ii)細調整されたモデルの大きさ。
既存のGFMは、生の衛星画像を処理するためのワークフローが欠如しており、下流への適応はオリジナルのエンコーダの完全な複雑さを保っていることが多い。
1)生画像からモデル対応データセットに変換する自動データキュレーション,(2)コンパクトで計算効率のよいモデルを生成するタスク固有のモデル蒸留,(3)インタラクティブなWebマップアプリケーションとしてのシームレスなデプロイメント。
InstaGeoを用いて、3つの論文から得られたデータセットを再現し、洪水マッピングで-0.73 pp、作物のセグメンテーションで-0.20 pp、砂漠のロカスト予測で+1.79 ppの限界mIoU差を持つモデルを訓練した。
蒸留されたモデルは、標準的な微調整されたものよりも最大8倍小さく、FLOPやCO2排出量を最小限の精度で削減できる。
InstaGeoの合理化されたデータパイプラインを活用して、より大きな作物のセグメンテーションデータセットをキュレートし、60.65%の最先端のmIoUを実現しました。
さらに、InstaGeoでは、生のデータから、単一の作業日内にデプロイをモデル化できる。
データ準備、モデル圧縮、展開を統合することで、InstaGeoは研究グレードのGFMを、リアルタイムで大規模な地球観測のための実用的で低炭素のツールに変換する。
このアプローチは、地理空間AIをデータ品質とアプリケーション駆動のイノベーションにシフトさせる。
ソースコード、データセット、モデルチェックポイントは、https://github.com/instadeepai/InstaGeo-E2E-Geospatial-ML.gitで入手できる。
関連論文リスト
- GeoAnalystBench: A GeoAI benchmark for assessing large language models for spatial analysis workflow and code generation [32.22754624992446]
実世界の地理空間問題から派生したPythonベースのタスク50のベンチマークであるGeoAnalystBenchを紹介する。
このベンチマークを用いて、プロプライエタリモデルとオープンソースモデルの両方を評価します。
ChatGPT-4o-miniのようなプロプライエタリなモデルは95%の妥当性とより強力なコードアライメントを実現します。
論文 参考訳(メタデータ) (2025-09-07T00:51:57Z) - Geo2Vec: Shape- and Distance-Aware Neural Representation of Geospatial Entities [13.206124101350847]
署名された距離場(SDF)にインスパイアされた新しい手法であるGeo2Vecを導入し、元の空間で直接動作する。
SDFを近似するように訓練されたニューラルネットワークは、すべてのジオエンタリティタイプに対してコンパクトで幾何学的、統一された表現を生成する。
実験結果から,Geo2Vecは形状と位置を表す既存の手法より一貫して優れており,トポロジカルおよび距離の関係を捉え,実世界のGeoAIアプリケーションにおいて高い効率を実現していることがわかった。
論文 参考訳(メタデータ) (2025-08-26T07:12:28Z) - On Geometry-Enhanced Parameter-Efficient Fine-Tuning for 3D Scene Segmentation [52.96632954620623]
本稿では3Dポイント・クラウド・トランス用に設計された新しい幾何対応PEFTモジュールを提案する。
当社のアプローチでは,大規模3Dポイントクラウドモデルの効率的,スケーラブル,かつ幾何を考慮した微調整のための新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2025-05-28T15:08:36Z) - GeoAggregator: An Efficient Transformer Model for Geo-Spatial Tabular Data [5.40483645224129]
本稿では地理空間データモデリングのための効率的かつ軽量なアルゴリズムGeoAggregatorを紹介する。
我々は、空間統計モデル、XGBoost、およびいくつかの最先端地理空間深層学習法と比較した。
その結果、GeoAggregatorsは、ほぼすべてのデータセットで競合相手と比較して、ベストまたはセカンドベストのパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-02-20T20:39:15Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - AnySat: One Earth Observation Model for Many Resolutions, Scales, and Modalities [5.767156832161819]
本稿では,JEPAとスケール適応型空間エンコーダに基づくマルチモーダルモデルであるAnySatを提案する。
この統一アプローチの利点を実証するため、異なる特徴を持つ5つのマルチモーダルデータセットの集合であるGeoPlexをコンパイルする。
次に、これらの多様なデータセット上で、単一の強力なモデルを同時にトレーニングします。
論文 参考訳(メタデータ) (2024-12-18T18:11:53Z) - Graph Transformers for Large Graphs [57.19338459218758]
この研究は、モデルの特徴と重要な設計制約を識別することに焦点を当てた、単一の大規模グラフでの表現学習を前進させる。
この研究の重要な革新は、局所的な注意機構と組み合わされた高速な近傍サンプリング技術の作成である。
ogbn-products と snap-patents の3倍の高速化と16.8%の性能向上を報告し、ogbn-100M で LargeGT を5.9% の性能改善で拡張した。
論文 参考訳(メタデータ) (2023-12-18T11:19:23Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoDTR+: Toward generic cross-view geolocalization via geometric disentanglement [20.346145927174373]
Cross-View Geo-Localization (CVGL) は、データベース内のジオタグ付き空中画像とマッチングすることで、地上画像の位置を推定する。
既存の手法は、トレーニングデータとテストデータが完全に異なる領域から取得されるクロスエリア評価において、依然としてパフォーマンスの低下に悩まされている。
視覚的特徴の幾何学的レイアウトを抽出する能力の欠如と,低レベルの細部への過度な適合が原因と考えられる。
本研究では,視覚的特徴間の相関をモデル化する拡張GLEモジュールを用いたGeoDTR+を提案する。
論文 参考訳(メタデータ) (2023-08-18T15:32:01Z) - GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文 参考訳(メタデータ) (2023-03-27T17:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。