論文の概要: Inferring Height from Earth Embeddings: First insights using Google AlphaEarth
- arxiv url: http://arxiv.org/abs/2602.17250v1
- Date: Thu, 19 Feb 2026 10:52:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.924606
- Title: Inferring Height from Earth Embeddings: First insights using Google AlphaEarth
- Title(参考訳): Google AlphaEarthを使って地球埋め込みから高度を推定する
- Authors: Alireza Hamoudzadeh, Valeria Belloni, Roberta Ravanelli,
- Abstract要約: 本研究では,地空間とマルチモーダルの特徴をテキストにエンコードすることで,深層学習(DL)回帰モデルを地域表面高マッピングに効果的に導くことができるかを検討する。
空間分解能10mのAlphaEarth Embeddingsに着目し,高画質のDSM(Digital Surface Model)を基準とした高さ推定能力の評価を行った。
両方のアーキテクチャは(どちらも$R2 = 0.97$で)強力なトレーニング性能を達成し、埋め込みが情報および復調可能な高さ関連の信号を符号化していることを確認した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study investigates whether the geospatial and multimodal features encoded in \textit{Earth Embeddings} can effectively guide deep learning (DL) regression models for regional surface height mapping. In particular, we focused on AlphaEarth Embeddings at 10 m spatial resolution and evaluated their capability to support terrain height inference using a high-quality Digital Surface Model (DSM) as reference. U-Net and U-Net++ architectures were thus employed as lightweight convolutional decoders to assess how well the geospatial information distilled in the embeddings can be translated into accurate surface height estimates. Both architectures achieved strong training performance (both with $R^2 = 0.97$), confirming that the embeddings encode informative and decodable height-related signals. On the test set, performance decreased due to distribution shifts in height frequency between training and testing areas. Nevertheless, U-Net++ shows better generalization ($R^2 = 0.84$, median difference = -2.62 m) compared with the standard U-Net ($R^2 = 0.78$, median difference = -7.22 m), suggesting enhanced robustness to distribution mismatch. While the testing RMSE (approximately 16 m for U-Net++) and residual bias highlight remaining challenges in generalization, strong correlations indicate that the embeddings capture transferable topographic patterns. Overall, the results demonstrate the promising potential of AlphaEarth Embeddings to guide DL-based height mapping workflows, particularly when combined with spatially aware convolutional architectures, while emphasizing the need to address bias for improved regional transferability.
- Abstract(参考訳): 本研究では,地域表面高マッピングのための深層学習回帰モデル(DL)を効果的に導くことができるかを検討した。
特に,空間分解能10mのAlphaEarth Embeddingsに着目し,高品質なDSM(Digital Surface Model)を参考に,地形の高さ推定を支援する能力を評価した。
したがって、U-NetとU-Net++アーキテクチャは、埋め込みで蒸留された地理空間情報の正確な表面高さ推定値への変換精度を評価するために、軽量な畳み込みデコーダとして使用された。
両方のアーキテクチャは(どちらも$R^2 = 0.97$で)強力なトレーニング性能を達成し、埋め込みが情報および復調可能な高さ関連信号を符号化していることを確認した。
テストセットでは, トレーニング領域と試験領域の間の高さ周波数の分布変化により, 性能が低下した。
それでも、U-Net++は標準的なU-Net(R^2 = 0.84$, 中央値差 = -2.62m)と比較して、より良い一般化を示す(R^2 = 0.78$, 中央値差 = -7.22m)。
RMSE(U-Net++の約16m)と残留バイアスは、一般化における残る課題を浮き彫りにしているが、強い相関関係は、埋め込みが転送可能な地形パターンを捉えていることを示している。
総じて,AlphaEarth Embeddingsは,特に空間的に認識される畳み込みアーキテクチャと組み合わせることで,高度マッピングワークフローをガイドする可能性を示すとともに,地域移動性の向上のためにバイアスに対処する必要性を強調した。
関連論文リスト
- Cross-Layer Attentive Feature Upsampling for Low-latency Semantic Segmentation [52.01210390327581]
本稿では,高精細度特徴とセマンティック特徴を適応的に補間するためのガイド付き注意補間(GAI)を提案する。
GAIは、解像度の異なる特徴から画素の空間的関係と意味的関係を判定し、これらの関係を利用してリッチな意味論で高解像度特徴を補間する。
実験では、GAINと呼ばれるGAIベースのセマンティックセグメンテーションネットワークは、Cityscapesで22.3 FPSの78.8 mIoU、CamVidで64.5の80.6 mIoUをNVIDIA 1080Ti GPUで達成できる。
論文 参考訳(メタデータ) (2026-01-03T12:09:49Z) - SERA-H: Beyond Native Sentinel Spatial Limits for High-Resolution Canopy Height Mapping [3.8902217877872034]
森林管理と生物多様性モニタリングには高分解能の天蓋の高さマッピングが不可欠である。
超高分解能モジュールと時間的アテンションエンコーディングを組み合わせたエンドツーエンドモデルSERA-Hを提案する。
本モデルでは,自由利用可能なSentinel-1とSentinel-2時系列データから2.5mの高さマップを生成する。
論文 参考訳(メタデータ) (2025-12-19T23:23:14Z) - Geodiffussr: Generative Terrain Texturing with Elevation Fidelity [48.82552523546255]
テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrを紹介する。
マルチスケールコンテンツアグリゲーション(MCA): DEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカライズされた高度の一貫性が強制される。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像と視覚接地型自然出現キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
論文 参考訳(メタデータ) (2025-11-28T09:52:44Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Multimodal deep learning for mapping forest dominant height by fusing
GEDI with earth observation data [5.309673841813994]
そこで本稿では,マルチモーダルアテンションリモートセンシングネットワーク(MARSNet)と呼ばれる新しいディープラーニングフレームワークを提案する。
MARSNetは、マルチスケール特徴を抽出するリモートセンシングデータモダリティごとに別々のエンコーダと、特徴と推定高さを融合する共有デコーダから構成される。
本研究は,GEDIとSAR,受動光学画像とを併用した多モード深層学習手法の有効性を示す。
論文 参考訳(メタデータ) (2023-11-20T14:02:50Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - On the Importance of Feature Representation for Flood Mapping using
Classical Machine Learning Approaches [3.555368338253582]
地球観測データに基づく洪水の浸水マッピングは、洪水の影響を受けた地域を、ほぼリアルタイムで緊急救助隊に、安価で正確な地図を提供するのに役立つ。
本稿では,勾配向上決定木,支持ベクトルマシン,二次判別分析など,従来の5つの機械学習手法の可能性について検討する。
これまでに報告した0.8751と0.7031のIoU値を0.70と0.5873と比較すると、単純な勾配増強分類器はディープニューラルネットワークに基づくアプローチよりも大幅に改善できることが示されている。
論文 参考訳(メタデータ) (2023-03-01T17:39:08Z) - Cross-view Geo-localization via Learning Disentangled Geometric Layout
Correspondence [11.823147814005411]
クロスビュージオローカライゼーションは、参照ジオタグ付き空中画像データベースとマッチングすることで、クエリーグラウンド画像の位置を推定することを目的としている。
最近の研究は、クロスビューなジオローカライゼーションベンチマークにおいて顕著な進歩を遂げている。
しかし、既存の手法は依然としてクロスエリアベンチマークのパフォーマンスの低下に悩まされている。
論文 参考訳(メタデータ) (2022-12-08T04:54:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。