論文の概要: What's in an Earth Embedding? An Explainability Analysis of Location Encoders
- arxiv url: http://arxiv.org/abs/2606.24997v1
- Date: Tue, 23 Jun 2026 16:01:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.087508
- Title: What's in an Earth Embedding? An Explainability Analysis of Location Encoders
- Title(参考訳): 地球埋め込みとは何か? 位置エンコーダの説明可能性解析
- Authors: Livia Betti, Sebastian Ricke, Ivica Obadic, Adam J. Stewart, Esther Rolf,
- Abstract要約: 地理埋め込み (INRs) は、地球上の座標を場所へマッピングすることを学ぶ。
人間の解釈可能な表現への埋め込みを解析する。
位置埋め込みは人間の解釈可能な表現に分解可能であることを示す。
- 参考スコア(独自算出の注目度): 6.103957378939232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Geographic implicit neural representations (INRs) learn to map any coordinate on Earth to a location embedding, implicitly encoding geospatial data into the weights of a neural network. Location embeddings are widely used off the shelf as general-purpose geospatial representations, yet users lack principled tools to audit what geographic or semantic information these embeddings capture. In this work, we analyze the information content of geographic INRs through their location embeddings. We decompose these embeddings into human-interpretable features$\unicode{x2014}$namely, (i) sparse latent concepts, (ii) natural language concepts, and (iii) visual features. The latent concept embeddings are learned using sparse autoencoders. To recover natural language concepts, we apply sparse linear concept embeddings (SpLiCE) over a predefined geospatial dictionary. Finally, visual features are extracted using saliency maps derived from CLIP Surgery. We show that location embeddings can be decomposed into human-interpretable representations while retaining high reconstruction capability, revealing interpretable geographic structures such as forests, deserts, and urban features. Across methods, sparse decompositions expose systematic differences in encoded information, ranging from urban structures to broader biome and climate signals, and pretraining-space saliency maps further highlight complementary features such as roads and landmarks. We hope this work provides a first step toward interpretable geospatial representations.
- Abstract(参考訳): 地理的暗黙的ニューラルネットワーク表現(INR)は、地球上の任意の座標を位置埋め込みにマッピングし、地理空間データをニューラルネットワークの重みに暗黙的に符号化する。
位置埋め込みは、汎用的な地理空間表現として棚から広く使われているが、ユーザーは、これらの埋め込みがどのような地理的または意味的な情報をキャプチャするかを監査する、原則化されたツールが欠けている。
本研究では,地理的INRの位置情報埋め込みによる情報内容の分析を行う。
これらの埋め込みを人間解釈可能な機能$\unicode{x2014}$namelyに分解する。
(i)緩やかな潜伏概念
(二)自然言語の概念、及び
(三)視覚的特徴。
潜在概念の埋め込みはスパースオートエンコーダを用いて学習される。
自然言語の概念を回復するために,事前に定義された地理空間辞書に疎線形な概念埋め込み(SpLiCE)を適用する。
最後に、CLIPオペレーショナルマップから得られる視覚的特徴を抽出する。
本研究では, 森林, 砂漠, 都市の特徴などの解釈可能な地理的構造を明らかにするとともに, 高い復元能力を維持しつつ, 位置埋め込みを人間の解釈可能な表現に分解できることを示す。
スパース分解は、都市構造からより広いバイオミーや気候信号まで、エンコードされた情報の体系的な違いを明らかにし、事前訓練空間のサリエンシマップは、道路やランドマークのような補完的な特徴をさらに強調する。
この研究が地理空間表現の解釈に向けた第一歩になることを願っている。
関連論文リスト
- Geospatial Mechanistic Interpretability of Large Language Models [6.0272491755196045]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる前例のない機能を示している。
我々の目的は、これらの複雑なモデルが地理的情報を処理しながら生成する内部表現の理解を深めることである。
論文 参考訳(メタデータ) (2025-05-06T09:40:06Z) - MapExplorer: New Content Generation from Low-Dimensional Visualizations [60.02149343347818]
低次元の可視化や「投影マップ」は大規模で複雑なデータセットの解釈に広く用いられている。
これらの視覚化は、既存の知識空間を理解するのに役立つだけでなく、未知の領域への探索を暗黙的にガイドする。
プロジェクションマップ内の座標をコヒーレントでコンテキストに整合したテキストコンテンツに変換する新しい知識発見タスクであるMapExplorerを紹介する。
論文 参考訳(メタデータ) (2024-12-24T20:16:13Z) - Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.624970503498226]
本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文 参考訳(メタデータ) (2024-03-11T18:09:50Z) - SatCLIP: Global, General-Purpose Location Embeddings with Satellite Imagery [22.716322265391852]
衛星コントラスト位置画像事前学習(SatCLIP)について紹介する。
SatCLIPは、公開衛星画像のCNNとViTの視覚パターンを地理的座標と一致させることで、位置の暗黙的な表現を学習する。
実験では、温度予測、動物認識、人口密度推定を含む9つの異なる位置依存タスクにおいて、SatCLIP埋め込みを用いて予測性能を向上させる。
論文 参考訳(メタデータ) (2023-11-28T19:14:40Z) - Automated mapping of virtual environments with visual predictive coding [0.9591674293850556]
本稿では,エージェントが視覚的予測コーディングをしながら仮想環境をナビゲートするフレームワークを提案する。
次の画像予測タスクを学習しながら、エージェントは、距離を定量的に反映する環境の内部表現を自動的に構築する。
内部マップにより、エージェントは視覚情報のみを使用してランドマークに対して位置を特定できる。
論文 参考訳(メタデータ) (2023-08-20T22:29:16Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - SIRI: Spatial Relation Induced Network For Spatial Description
Resolution [64.38872296406211]
言語誘導型ローカライゼーションのための新しい関係誘導型ネットワーク(SIRI)を提案する。
提案手法は,80ピクセルの半径で測定した精度で,最先端手法よりも約24%優れていた。
提案手法は,Touchdownと同じ設定で収集した拡張データセットをうまく一般化する。
論文 参考訳(メタデータ) (2020-10-27T14:04:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。