論文の概要: Foundation Models for Geospatial Reasoning: Assessing Capabilities of Large Language Models in Understanding Geometries and Topological Spatial Relations
- arxiv url: http://arxiv.org/abs/2505.17136v1
- Date: Thu, 22 May 2025 05:21:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.598315
- Title: Foundation Models for Geospatial Reasoning: Assessing Capabilities of Large Language Models in Understanding Geometries and Topological Spatial Relations
- Title(参考訳): 地理空間推論の基礎モデル:ジオメトリとトポロジカル空間関係の理解における大規模言語モデルの能力評価
- Authors: Yuhan Ji, Song Gao, Ying Nie, Ivan Majić, Krzysztof Janowicz,
- Abstract要約: 本研究では、空間的推論において、よく知られたテクスト(WKT)表現とその空間的関係が保持される範囲について検討する。
我々のワークフローは、比較のための空間的推論タスクを完成させるために、3つの異なるアプローチを採用している。
- 参考スコア(独自算出の注目度): 4.302482081136594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Applying AI foundation models directly to geospatial datasets remains challenging due to their limited ability to represent and reason with geographical entities, specifically vector-based geometries and natural language descriptions of complex spatial relations. To address these issues, we investigate the extent to which a well-known-text (WKT) representation of geometries and their spatial relations (e.g., topological predicates) are preserved during spatial reasoning when the geospatial vector data are passed to large language models (LLMs) including GPT-3.5-turbo, GPT-4, and DeepSeek-R1-14B. Our workflow employs three distinct approaches to complete the spatial reasoning tasks for comparison, i.e., geometry embedding-based, prompt engineering-based, and everyday language-based evaluation. Our experiment results demonstrate that both the embedding-based and prompt engineering-based approaches to geospatial question-answering tasks with GPT models can achieve an accuracy of over 0.6 on average for the identification of topological spatial relations between two geometries. Among the evaluated models, GPT-4 with few-shot prompting achieved the highest performance with over 0.66 accuracy on topological spatial relation inference. Additionally, GPT-based reasoner is capable of properly comprehending inverse topological spatial relations and including an LLM-generated geometry can enhance the effectiveness for geographic entity retrieval. GPT-4 also exhibits the ability to translate certain vernacular descriptions about places into formal topological relations, and adding the geometry-type or place-type context in prompts may improve inference accuracy, but it varies by instance. The performance of these spatial reasoning tasks offers valuable insights for the refinement of LLMs with geographical knowledge towards the development of geo-foundation models capable of geospatial reasoning.
- Abstract(参考訳): AI基盤モデルを地理空間データセットに直接適用することは、地理的エンティティ、特にベクトルベースのジオメトリや複雑な空間関係の自然言語記述を表現および推論する能力に制限があるため、依然として難しい。
これらの問題に対処するために,GPT-3.5-turbo,GPT-4,DeepSeek-R1-14Bを含む大規模言語モデル(LLM)に地理空間ベクトルデータが渡される場合の空間的推論において,よく知られたテクスト(WKT)表現とその空間的関係(例えばトポロジカル述語)が保持される範囲について検討する。
このワークフローでは,空間的推論タスクの完成に3つの異なるアプローチ,すなわち幾何学的埋め込み,素早い工学的手法,日常的な言語的評価を採用している。
実験の結果,GPTモデルを用いた地理空間質問応答における組込み型および迅速な工学的アプローチは,2つの測地間の位相空間関係の同定において,平均0.6以上の精度を達成できることがわかった。
評価モデルのうち、GPT-4は、位相的空間的関係推論において0.66以上の精度で最高性能を達成した。
さらに、GPTベースの推論器は、逆位相空間関係を適切に解釈することができ、LLM生成幾何を含むことにより、地理的実体検索の有効性を高めることができる。
GPT-4はまた、場所に関する特定の頂点記述を形式的トポロジカルな関係に翻訳する能力を示し、プロンプトに幾何学型または場所型コンテキストを追加することで推論精度が向上するが、例によって異なる。
これらの空間的推論タスクの性能は,空間的推論が可能な測地境界モデルの開発に向けて,地理的知識でLLMを洗練するための貴重な洞察を提供する。
関連論文リスト
- Geography-Aware Large Language Models for Next POI Recommendation [21.03555605703108]
Next Point-of-Interest(POI)レコメンデーションタスクは,過去の移動データに基づいてユーザの次の目的地を予測することを目的としている。
GA-LLM(Geography-Aware Large Language Model)は,2つの特殊なコンポーネントを持つ大規模言語モデルを強化する新しいフレームワークである。
3つの実世界のデータセットの実験は、GA-LLMの最先端性能を実証している。
論文 参考訳(メタデータ) (2025-05-18T03:20:20Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - PEACE: Empowering Geologic Map Holistic Understanding with MLLMs [64.58959634712215]
地質図は地質学の基本的な図として、地球の地下と地表の構造と構成に関する重要な洞察を提供する。
その重要性にもかかわらず、現在のマルチモーダル大言語モデル(MLLM)は地質図の理解に乏しいことが多い。
このギャップを定量化するために、地質地図理解においてMLLMを評価するための最初のベンチマークであるGeoMap-Benchを構築した。
論文 参考訳(メタデータ) (2025-01-10T18:59:42Z) - Geometric Feature Enhanced Knowledge Graph Embedding and Spatial Reasoning [8.561588656662419]
Geospatial Knowledge Graphs (GeoKGs) は地理と空間関係を相互にモデル化する。
一般的な知識グラフ埋め込み(KGE)技術のような、GeoKGからの採掘と推論のための既存の手法は、認識を欠いている。
本研究の目的は,新しい戦略を開発し,空間関係の幾何学的特徴を統合することで汎用KGEを強化することである。
論文 参考訳(メタデータ) (2024-10-24T00:53:48Z) - Self-Supervised Representation Learning for Geospatial Objects: A Survey [21.504978593542354]
自己教師付き学習(SSL)は、広範囲にラベル付けされた監督なしでデータから直接効果的で一般化可能な表現を学習できる能力に注目が集まっている。
本稿では,3種類の幾何学的ベクトルタイプ(ポイント,ポリライン,ポリゴン)において,地理空間オブジェクトに対して特別に適用または開発されたSSL技術について調査する。
地空間オブジェクトに対するSSLの出現傾向,特に地空間基盤モデルへの段階的な進歩について検討する。
論文 参考訳(メタデータ) (2024-08-22T05:28:22Z) - GeoReasoner: Reasoning On Geospatially Grounded Context For Natural Language Understanding [0.32885740436059047]
GeoReasonerは、地理的に接地された自然言語を推論できる言語モデルである。
まず、Large Language Modelsを利用して、言語推論と距離情報に基づく総合的な位置記述を生成する。
また、方向と距離の情報を擬似文として扱うことで空間埋め込みに符号化する。
論文 参考訳(メタデータ) (2024-08-21T06:35:21Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Evaluating the Effectiveness of Large Language Models in Representing
Textual Descriptions of Geometry and Spatial Relations [2.8935588665357086]
本研究では,大規模言語モデル(LLM)の空間的関係の表現能力を評価することに焦点を当てた。
我々は GPT-2 や BERT などの LLM を用いて、よく知られたジオメトリのテキスト (WKT) フォーマットを符号化し、それらの埋め込みを分類器や回帰器に入力する。
実験では、LLMが生成した埋め込みは幾何型を保存し、いくつかの空間的関係(精度は73%まで)を捉えることができるが、数値を推定し、空間的関連オブジェクトを検索する際の課題が残っている。
論文 参考訳(メタデータ) (2023-07-05T03:50:08Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - Geometry Interaction Knowledge Graph Embeddings [153.69745042757066]
ユークリッド空間,双曲空間,超球空間間の空間構造を対話的に学習する幾何学的相互作用知識グラフ埋め込み(GIE)を提案する。
提案したGIEは、よりリッチなリレーショナル情報、モデルキー推論パターンをキャプチャし、エンティティ間の表現的セマンティックマッチングを可能にする。
論文 参考訳(メタデータ) (2022-06-24T08:33:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。