論文の概要: Scalable Geospatial Data Generation Using AlphaEarth Foundations Model
- arxiv url: http://arxiv.org/abs/2508.11739v1
- Date: Fri, 15 Aug 2025 17:09:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.353547
- Title: Scalable Geospatial Data Generation Using AlphaEarth Foundations Model
- Title(参考訳): AlphaEarth Foundationsモデルを用いたスケーラブルな地理空間データ生成
- Authors: Luc Houriez, Sebastian Pilarski, Behzad Vahedi, Ali Ahmadalipour, Teo Honda Scully, Nicholas Aflitto, David Andre, Caroline Jaffe, Martha Wedner, Rich Mazzola, Josh Jeffery, Ben Messinger, Sage McGinley-Smith, Sarah Russell,
- Abstract要約: 我々は,Google DeepMindのAlphaEarth Foundations(AEF)を活用して地理空間ラベル付きデータセットを初期地域を超えて拡張する手法を提案し,評価する。
ランダム・フォレストやロジスティック・レグレッションのような基本的なモデルでも、このタスクを達成できることが示されています。
本研究では,LANDFIRE の既存植生型 (EVT) データセットを米国からカナダへ2段階の粒度で拡張する事例について検討する。
- 参考スコア(独自算出の注目度): 0.1775251182905249
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality labeled geospatial datasets are essential for extracting insights and understanding our planet. Unfortunately, these datasets often do not span the entire globe and are limited to certain geographic regions where data was collected. Google DeepMind's recently released AlphaEarth Foundations (AEF) provides an information-dense global geospatial representation designed to serve as a useful input across a wide gamut of tasks. In this article we propose and evaluate a methodology which leverages AEF to extend geospatial labeled datasets beyond their initial geographic regions. We show that even basic models like random forests or logistic regression can be used to accomplish this task. We investigate a case study of extending LANDFIRE's Existing Vegetation Type (EVT) dataset beyond the USA into Canada at two levels of granularity: EvtPhys (13 classes) and EvtGp (80 classes). Qualitatively, for EvtPhys, model predictions align with ground truth. Trained models achieve 81% and 73% classification accuracy on EvtPhys validation sets in the USA and Canada, despite discussed limitations.
- Abstract(参考訳): 高品質なラベル付き地理空間データセットは、我々の惑星の洞察を抽出し理解するために不可欠である。
残念ながら、これらのデータセットは世界中に分散せず、収集された特定の地理的領域に限定されていることが多い。
Google DeepMindが最近リリースしたAlphaEarth Foundations (AEF)は、幅広いタスクにまたがる有用な入力として設計された、情報密度のグローバルな地理空間表現を提供する。
本稿では、AFFを利用して地理的ラベル付きデータセットを初期地域を超えて拡張する手法を提案し、評価する。
ランダム・フォレストやロジスティック・レグレッションのような基本的なモデルでも、このタスクを達成できることが示されています。
本研究では,LANDFIRE の既存植生型 (EVT) データセットを米国からカナダに2段階の粒度で拡張する事例について検討した。
定性的には、EvtPhysにとって、モデル予測は基礎的な真実と一致している。
訓練されたモデルは、制限が議論されているにもかかわらず、米国とカナダのEvtPhys検証セットで81%と73%の分類精度を達成する。
関連論文リスト
- AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data [18.7927140265097]
我々は、高度に一般化された地理空間表現をもたらす埋め込み場モデルであるAlphaEarth Foundationsを紹介する。
2017年から2024年にかけて、グローバル、年次、分析対応の埋め込みフィールドレイヤのデータセットをリリースします。
論文 参考訳(メタデータ) (2025-07-29T23:55:00Z) - HyBiomass: Global Hyperspectral Imagery Benchmark Dataset for Evaluating Geospatial Foundation Models in Forest Aboveground Biomass Estimation [1.0408909053766147]
本研究では,森林表層バイオマス(AGB)推定のためのグローバル分散ベンチマークデータセットを提案する。
このベンチマークデータセットは、環境マッピング・分析プログラム(EnMAP)衛星からのHSIと、AGB密度推定の予測を組み合わせたものである。
このデータセットを用いた実験結果から,評価されたGeo-FMがベースラインU-Netの性能を上回り得るか,場合によっては超えることを示した。
論文 参考訳(メタデータ) (2025-06-12T21:29:20Z) - GeoGrid-Bench: Can Foundation Models Understand Multimodal Gridded Geo-Spatial Data? [5.017671236021897]
GeoGrid-Benchは、グリッド構造における地理空間データを理解する基礎モデルの能力を評価するために設計されたベンチマークである。
このベンチマークでは、150カ所にわたる16の気候変数と、拡張された時間フレームをカバーする、大規模で現実的なデータを取り上げている。
論文 参考訳(メタデータ) (2025-05-15T21:31:44Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - GeoGalactica: A Scientific Large Language Model in Geoscience [95.15911521220052]
大規模言語モデル(LLM)は、自然言語処理(NLP)における幅広いタスクを解く一般的な知識と能力で大きな成功を収めている。
我々は、LLMを地学に特化させ、さらに、地学の膨大なテキストでモデルを事前訓練し、また、カスタム収集した指導チューニングデータセットで得られたモデルを教師付き微調整(SFT)する。
我々はGeoGalacticaを65億のトークンを含む地球科学関連のテキストコーパスで訓練し、最大の地球科学固有のテキストコーパスとして保存する。
次に、100万対の命令チューニングでモデルを微調整する。
論文 参考訳(メタデータ) (2023-12-31T09:22:54Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - Assessment of a new GeoAI foundation model for flood inundation mapping [4.312965283062856]
そこで本稿は,IBM-NASAのPrithviによる地空間基盤モデルの性能評価を行い,地空間解析の重要課題である洪水浸水マッピングを支援する。
実験では、ベンチマークデータセットであるSen1Floods11を使用し、モデルの予測可能性、一般化可能性、転送可能性を評価する。
以上の結果から, 未確認領域におけるセグメンテーションにおけるPrithviモデルの性能上の優位性が示された。
論文 参考訳(メタデータ) (2023-09-25T19:50:47Z) - K2: A Foundation Language Model for Geoscience Knowledge Understanding
and Utilization [105.89544876731942]
大規模言語モデル(LLM)は自然言語処理の一般分野において大きな成功を収めている。
我々は、地球科学におけるLLM研究をさらに促進するために開発された一連の資源とともに、地球科学における最初のLLMであるK2を提示する。
論文 参考訳(メタデータ) (2023-06-08T09:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。