論文の概要: Physically Interpretable AlphaEarth Foundation Model Embeddings Enable LLM-Based Land Surface Intelligence
- arxiv url: http://arxiv.org/abs/2602.10354v1
- Date: Tue, 10 Feb 2026 22:58:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.327037
- Title: Physically Interpretable AlphaEarth Foundation Model Embeddings Enable LLM-Based Land Surface Intelligence
- Title(参考訳): LLMをベースとした地表面インテリジェンスを実現する物理解釈可能なアルファアース基礎モデル
- Authors: Mashrekur Rahman,
- Abstract要約: 環境変数26に対して,Google AlphaEarthの64次元埋め込みを包括的に解析する。
次に、FAISSによる1210万ベクトルの埋め込みデータベース上での検索拡張生成を実装するランドサーフェスインテリジェンスシステムを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Satellite foundation models produce dense embeddings whose physical interpretability remains poorly understood, limiting their integration into environmental decision systems. Using 12.1 million samples across the Continental United States (2017--2023), we first present a comprehensive interpretability analysis of Google AlphaEarth's 64-dimensional embeddings against 26 environmental variables spanning climate, vegetation, hydrology, temperature, and terrain. Combining linear, nonlinear, and attention-based methods, we show that individual embedding dimensions map onto specific land surface properties, while the full embedding space reconstructs most environmental variables with high fidelity (12 of 26 variables exceed $R^2 > 0.90$; temperature and elevation approach $R^2 = 0.97$). The strongest dimension-variable relationships converge across all three analytical methods and remain robust under spatial block cross-validation (mean $ΔR^2 = 0.017$) and temporally stable across all seven study years (mean inter-year correlation $r = 0.963$). Building on these validated interpretations, we then developed a Land Surface Intelligence system that implements retrieval-augmented generation over a FAISS-indexed embedding database of 12.1 million vectors, translating natural language environmental queries into satellite-grounded assessments. An LLM-as-Judge evaluation across 360 query--response cycles, using four LLMs in rotating generator, system, and judge roles, achieved weighted scores of $μ= 3.74 \pm 0.77$ (scale 1--5), with grounding ($μ= 3.93$) and coherence ($μ= 4.25$) as the strongest criteria. Our results demonstrate that satellite foundation model embeddings are physically structured representations that can be operationalized for environmental and geospatial intelligence.
- Abstract(参考訳): 衛星基礎モデルは、物理的解釈可能性に乏しい密着な埋め込みを生成し、環境決定システムへの統合を制限している。
1210万サンプル(2017年-2023年)を用いて、気候、植生、水文学、温度、地形にまたがる26の環境変数に対して、Google AlphaEarthの64次元埋め込みの包括的な解釈可能性分析を行った。
線形, 非線形, 注意に基づく手法を組み合わせると, 個別の埋め込み次元が特定の陸面特性にマッピングされるのに対し, 完全な埋め込み空間は高い忠実度でほとんどの環境変数を再構成する(26変数中12変数が$R^2 > 0.90$; 温度と標高のアプローチで$R^2 = 0.97$; 以上)。
最強の次元-変数関係は3つの解析手法全てに収束し、空間ブロック交叉 (平均$ΔR^2 = 0.017$) の下で頑健であり、7つの研究年にわたって時間的に安定である(平均年間相関$r = 0.963$)。
これらの検証された解釈に基づいて, FAISSによる1210万ベクトルの埋め込みデータベース上での検索強化生成を実装したランドサーフェス・インテリジェンス(Land Surface Intelligence)システムを開発した。
LLM-as-Judge 評価は, 回転発電機, システム, 判断役の 4 つの LLM を用いて, 最大基準としてμ= 3.74 \pm 0.77$ (スケール1--5), グラウンド(μ= 3.93$) とコヒーレンス(μ= 4.25$) の重み付けスコアを得た。
衛星基盤モデル埋め込みは物理的に構造化された表現であり, 環境や地理空間のインテリジェンスに対して操作可能であることを示す。
関連論文リスト
- Democratizing planetary-scale analysis: An ultra-lightweight Earth embedding database for accurate and flexible global land monitoring [19.019853798955513]
ESDは、2000年から2024年までの25年間にわたる、超軽量で30mの地球埋め込みデータベースである。
データセットは、生のアーカイブと比較してデータボリュームが340倍に減少する。
頑丈な数発の学習能力と長手一貫性により、ESDは惑星スケールの研究を民主化するための汎用的な基盤を提供する。
論文 参考訳(メタデータ) (2026-01-16T10:59:43Z) - Geo3DVQA: Evaluating Vision-Language Models for 3D Geospatial Reasoning from Aerial Imagery [18.7420518276348]
Geo3DVQA(Geo3DVQA)は、高度対応3次元地理空間推論における視覚言語モデル(VLM)の評価ベンチマークである。
従来のセンサーベースのフレームワークとは異なり、Geo3DVQAは標高、スカイビュー要素、ランドカバーパターンを統合する現実的なシナリオを強調している。
論文 参考訳(メタデータ) (2025-12-08T08:16:14Z) - Where on Earth? A Vision-Language Benchmark for Probing Model Geolocation Skills Across Scales [61.03549470159347]
視覚言語モデル (VLM) は急速に進歩しているが, オープンワールド環境における画像位置決め能力は, 網羅的に評価されていない。
我々は、視覚認識、ステップバイステップ推論、エビデンス利用を評価するVLM画像位置情報の総合ベンチマークであるEarthWhereを提示する。
論文 参考訳(メタデータ) (2025-10-13T01:12:21Z) - FuseTen: A Generative Model for Daily 10 m Land Surface Temperature Estimation from Spatio-Temporal Satellite Observations [3.344876133162209]
都市熱波、干ばつ、陸熱波は、気候変動の文脈において、ますます困難を増している。
これらの現象を評価し理解するための最も重要な変数の1つはランドサーフェス温度(LST)である。
本研究では,ランドサット8号とテラMODIS号の時空間観測により,毎日10mの空間分解能でLST観測を行うFuseTenを提案する。
論文 参考訳(メタデータ) (2025-07-30T23:04:16Z) - OmniEarth-Bench: Towards Holistic Evaluation of Earth's Six Spheres and Cross-Spheres Interactions with Multimodal Observational Earth Data [72.98496934729245]
地球科学におけるマルチモーダル学習のための既存のベンチマークは、地球の球体とその球体間相互作用の限定されたサイロ化されたカバレッジを提供する。
textbf OmniEarth-Benchは、6つの球体すべてに体系的にまたがる最初のマルチモーダルベンチマークである。
OmniEarth-Benchはスケーラブルでモジュール型のトポロジデータ推論フレームワークとネイティブなマルチオブザーブレーションソースで構築され、29,855の標準化された専門家によるアノテーションを生成する。
論文 参考訳(メタデータ) (2025-05-29T15:02:27Z) - AnySat: One Earth Observation Model for Many Resolutions, Scales, and Modalities [5.767156832161819]
本稿では,JEPAとスケール適応型空間エンコーダに基づくマルチモーダルモデルであるAnySatを提案する。
この統一アプローチの利点を実証するため、異なる特徴を持つ5つのマルチモーダルデータセットの集合であるGeoPlexをコンパイルする。
次に、これらの多様なデータセット上で、単一の強力なモデルを同時にトレーニングします。
論文 参考訳(メタデータ) (2024-12-18T18:11:53Z) - SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models [78.06537464850538]
シミュレーションは,実画像に翻訳する空間的適性を与えるのに驚くほど効果的であることを示す。
シミュレーションにおける完全アノテーションは、擬似アノテーション実画像の既存のアプローチよりも効果的であることを示す。
論文 参考訳(メタデータ) (2024-12-10T18:52:45Z) - Distortions in Judged Spatial Relations in Large Language Models [45.875801135769585]
GPT-4は55%の精度で優れた性能を示し、GPT-3.5は47%、Llama-2は45%であった。
モデルは、ほとんどの場合において最も近い基数方向を同定し、その連想学習機構を反映した。
論文 参考訳(メタデータ) (2024-01-08T20:08:04Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - Satellite galaxy abundance dependency on cosmology in Magneticum
simulations [101.18253437732933]
宇宙論的パラメータに基づく衛星量のエミュレータを構築した。
A$ と $beta$ はたとえ弱いとしても、宇宙的パラメータに依存する。
また、衛星の宇宙論の依存性は、フル物理シミュレーション(FP)、ダークマターシミュレーション(DMO)、非放射性シミュレーション(非放射性シミュレーション)の違いも示している。
論文 参考訳(メタデータ) (2021-10-11T18:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。