論文の概要: OSMGraphCLIP: Learning Global Location Representations from OpenStreetMap Graphs
- arxiv url: http://arxiv.org/abs/2606.08046v1
- Date: Sat, 06 Jun 2026 08:18:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.691294
- Title: OSMGraphCLIP: Learning Global Location Representations from OpenStreetMap Graphs
- Title(参考訳): OSMGraphCLIP: OpenStreetMap グラフからグローバルなロケーション表現を学習する
- Authors: Dimitrios Michail, Eleni Saka, Ioannis Giannopoulos, Ioannis Papoutsis,
- Abstract要約: OSMGraphCLIPは、型付きOpenStreetMap(OSM)機能の異種グラフとして地理環境を表す。
マルチスケールグラフエンコーダは、きめ細かい局所構造と広いランドスケープ構成の両方をキャプチャする。
構造化OSMデータだけでは、ドメイン間での強力なグローバルな位置表現がサポートできることを示す。
- 参考スコア(独自算出の注目度): 3.351125901721929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present OSMGraphCLIP, a CLIP-style geospatial representation model that learns global location embeddings from freely available OpenStreetMap (OSM) data. OSMGraphCLIP represents geographic environments as heterogeneous graphs of typed OSM features, preserving the topological and semantic relationships among roads, buildings, land-use regions, and points of interest. A multi-scale graph encoder captures both fine-grained local structure and broader landscape composition, and supervises a spherical-harmonics location encoder through a contrastive alignment objective. We evaluate OSMGraphCLIP across a diverse suite of downstream geospatial regression and classification tasks spanning climate, ecology, socioeconomic indicators, public health, land cover, biodiversity, and wildfire forecasting, and show that structured OSM data alone supports strong global location representations across domains. OSMGraphCLIP matches or exceeds satellite-based baselines on the majority of benchmarks, with the most pronounced advantage on socioeconomic and public-health tasks, where OSM's explicit semantic annotation of the built environment encodes patterns of human activity that satellite pixels can only capture indirectly. On ecological and environmental tasks, the model remains closely competitive with imagery-based methods despite using no Earth observation data. Qualitative analysis confirms that the learned embeddings organize geographic space coherently, recovering biome boundaries, urban gradients, and tropical--temperate distinctions from map topology alone.
- Abstract(参考訳): 我々は,利用可能なOpenStreetMap(OSM)データからグローバルな位置埋め込みを学習するCLIPスタイルの地理空間表現モデルOSMGraphCLIPを提案する。
OSMGraphCLIPは, 道路, 建物, 土地利用地域, 関心点間のトポロジ的および意味的関係を保存し, タイプ付きOSM特徴の異種グラフとして地理環境を表現している。
マルチスケールグラフエンコーダは、きめ細かな局所構造と広いランドスケープ構成の両方をキャプチャし、対照的なアライメント目的を通して球面-高調波位置エンコーダを監督する。
我々は、気候、生態学、社会経済指標、公衆衛生、土地被覆、生物多様性、山火事予報など、下流の地理空間レグレッションおよび分類タスクを多岐にわたるOSMGraphCLIPで評価し、構造化OSMデータだけでドメイン間の強いグローバルな位置表現をサポートすることを示す。
OSMGraphCLIPは、ほとんどのベンチマークで衛星ベースのベースラインと一致し、最も顕著な利点は社会経済的および公衆衛生的なタスクであり、構築された環境のOSMの明示的な意味的アノテーションは、衛星画素が間接的にしかキャプチャできない人間の活動パターンを符号化する。
地球観測データを使用しないにもかかわらず、生態的・環境的なタスクにおいて、このモデルは画像に基づく手法と密接に競合する。
定性的分析により、学習された埋め込みが地理的空間を整合的に整理し、生物相境界、都市勾配、熱帯温帯の区別を地図トポロジーだけと区別することが確認された。
関連論文リスト
- GeoViSTA: Geospatial Vision-Tabular Transformer for Multimodal Environment Representation [24.186635502118552]
ジオビスタ(Geospatial Vision-Tabular Transformer,Geospatial Vision-Tabular Transformer,Geospatial Vision-Tabular Transformer,Geospatial Vision-Tabular Transformer,Geospatial Vision-Tabular Transformer,Geospatial Vision-Tabular Transformer)を提案する。
我々は、GeoViSTAを自己教師付き共同マスク自動符号化目標で訓練し、欠落した画像パッチの復元を強制する。
結果は、構造化社会経済コンテキストとともに、物理的環境を共同でモデル化することで、高度に伝達可能な表現が得られることを示した。
論文 参考訳(メタデータ) (2026-05-14T05:46:07Z) - Revealing Geography-Driven Signals in Zone-Level Claim Frequency Models: An Empirical Study using Environmental and Visual Predictors [1.5484595752241122]
地理的文脈は、しばしば自動車保険のリスクに関連すると考えられているが、公共のアクチュアリアルデータセットは限られた位置識別子を提供する。
本研究では,MTPL(Motor Third Party Liability)のクレーム予測において,代替データからの地理情報をアクタリカルモデルに組み込む方法について検討した。
論文 参考訳(メタデータ) (2026-04-23T17:44:52Z) - Learning to Wander: Improving the Global Image Geolocation Ability of LMMs via Actionable Reasoning [72.13218601075958]
textbfWanderBenchは,具体的シナリオにおける行動可能な位置情報推論のための,最初のオープンアクセスグローバルジオロケーションベンチマークである。
我々は,下線Action of UnderlineThoughを用いた下線Geolocationフレームワークである textbfGeoAoT (Action of Thought) を提案する。
19個の大規模マルチモーダルモデルによる実験により、GeoAoTは動的環境におけるより優れた微細な局所化とより強力な一般化を実現することが示された。
論文 参考訳(メタデータ) (2026-03-11T06:24:10Z) - Global Cross-Modal Geo-Localization: A Million-Scale Dataset and a Physical Consistency Learning Framework [13.268717213871147]
クロスモーダルジオローカライゼーション(CMGL)は、地上レベルのテキスト記述とジオタグ付き空中画像とを一致させる。
グローバルCMGL専用の最初の100万規模のデータセットであるCOREを紹介する。
モーダルな地理的ローカライゼーションのための物理ロッド・アウェア・ネットワーク(PLANET)を提案する。
論文 参考訳(メタデータ) (2026-03-09T15:27:19Z) - GeoSURGE: Geo-localization using Semantic Fusion with Hierarchy of Geographic Embeddings [3.43519422766841]
我々は、クエリ画像の視覚的表現と学習された地理的表現との整合性として、地理的ローカライゼーションを定式化する。
主要な実験では、5つのベンチマークデータセットで測定された25のメトリクスのうち22のベストが改善された。
論文 参考訳(メタデータ) (2025-10-01T20:39:48Z) - HyBiomass: Global Hyperspectral Imagery Benchmark Dataset for Evaluating Geospatial Foundation Models in Forest Aboveground Biomass Estimation [1.0408909053766147]
本研究では,森林表層バイオマス(AGB)推定のためのグローバル分散ベンチマークデータセットを提案する。
このベンチマークデータセットは、環境マッピング・分析プログラム(EnMAP)衛星からのHSIと、AGB密度推定の予測を組み合わせたものである。
このデータセットを用いた実験結果から,評価されたGeo-FMがベースラインU-Netの性能を上回り得るか,場合によっては超えることを示した。
論文 参考訳(メタデータ) (2025-06-12T21:29:20Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。