論文の概要: MapQA: Open-domain Geospatial Question Answering on Map Data
- arxiv url: http://arxiv.org/abs/2503.07871v1
- Date: Mon, 10 Mar 2025 21:37:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:46:09.603827
- Title: MapQA: Open-domain Geospatial Question Answering on Map Data
- Title(参考訳): MapQA: オープンドメインの地理空間的質問に対するマップデータへの回答
- Authors: Zekun Li, Malcolm Grossman, Eric, Qasemi, Mihir Kulkarni, Muhao Chen, Yao-Yi Chiang,
- Abstract要約: MapQAは、質問に参照されるジオエンティティの問合せペアとジオメトリを提供する、新しいデータセットである。
3,154対のQAペアが9つの質問タイプにまたがって構成されており、近隣の推論やジオエンタリティタイプの識別など、地理空間的推論を必要とする。
- 参考スコア(独自算出の注目度): 30.998432707821127
- License:
- Abstract: Geospatial question answering (QA) is a fundamental task in navigation and point of interest (POI) searches. While existing geospatial QA datasets exist, they are limited in both scale and diversity, often relying solely on textual descriptions of geo-entities without considering their geometries. A major challenge in scaling geospatial QA datasets for reasoning lies in the complexity of geospatial relationships, which require integrating spatial structures, topological dependencies, and multi-hop reasoning capabilities that most text-based QA datasets lack. To address these limitations, we introduce MapQA, a novel dataset that not only provides question-answer pairs but also includes the geometries of geo-entities referenced in the questions. MapQA is constructed using SQL query templates to extract question-answer pairs from OpenStreetMap (OSM) for two study regions: Southern California and Illinois. It consists of 3,154 QA pairs spanning nine question types that require geospatial reasoning, such as neighborhood inference and geo-entity type identification. Compared to existing datasets, MapQA expands both the number and diversity of geospatial question types. We explore two approaches to tackle this challenge: (1) a retrieval-based language model that ranks candidate geo-entities by embedding similarity, and (2) a large language model (LLM) that generates SQL queries from natural language questions and geo-entity attributes, which are then executed against an OSM database. Our findings indicate that retrieval-based methods effectively capture concepts like closeness and direction but struggle with questions that require explicit computations (e.g., distance calculations). LLMs (e.g., GPT and Gemini) excel at generating SQL queries for one-hop reasoning but face challenges with multi-hop reasoning, highlighting a key bottleneck in advancing geospatial QA systems.
- Abstract(参考訳): 地理空間的質問応答(QA)はナビゲーションと関心点探索(POI)における基本的な課題である。
既存の地理空間的QAデータセットは存在するが、スケールと多様性の両方に制限があり、ジオメトリを考慮せずに、ジオテリティーのテキスト記述にのみ依存することが多い。
推論のための地理空間的QAデータセットのスケーリングにおける大きな課題は、ほとんどのテキストベースのQAデータセットに欠けている空間構造、トポロジカル依存関係、マルチホップ推論機能の統合を必要とする地理空間的関係の複雑さにある。
これらの制約に対処するために,質問応答ペアを提供するだけでなく,質問に参照されるジオテリティーのジオメトリを含む,新しいデータセットであるMapQAを導入する。
MapQAは、南カリフォルニアとイリノイの2つの研究領域において、OpenStreetMap (OSM)から質問応答ペアを抽出するためにSQLクエリテンプレートを使用して構築されている。
3,154対のQAペアが9つの質問タイプにまたがって構成されており、近隣の推論やジオエンタリティタイプの識別など、地理空間的推論を必要とする。
既存のデータセットと比較すると、MapQAは地理空間問題の種類の数と多様性の両方を拡大する。
この課題に対処する2つのアプローチを探る:(1)類似性を埋め込むことで候補ジオエンティリティをランク付けする検索ベース言語モデル、(2)自然言語質問からSQLクエリを生成する大規模言語モデルと、OSMデータベースに対して実行されるジオエンティリティ属性である。
この結果から,検索手法は近接性や方向といった概念を効果的にとらえるが,明示的な計算を必要とする問題(例えば距離計算)に悩むことが示唆された。
LLM(例えば、GPT、Gemini)は、ワンホップ推論のためのSQLクエリ生成に長けているが、マルチホップ推論の課題に直面しており、地理空間的QAシステムの進行における重要なボトルネックを浮き彫りにしている。
関連論文リスト
- Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - PEACE: Empowering Geologic Map Holistic Understanding with MLLMs [64.58959634712215]
地質図は地質学の基本的な図として、地球の地下と地表の構造と構成に関する重要な洞察を提供する。
その重要性にもかかわらず、現在のマルチモーダル大言語モデル(MLLM)は地質図の理解に乏しいことが多い。
このギャップを定量化するために、地質地図理解においてMLLMを評価するための最初のベンチマークであるGeoMap-Benchを構築した。
論文 参考訳(メタデータ) (2025-01-10T18:59:42Z) - MapQaTor: A System for Efficient Annotation of Map Query Datasets [3.3856216159724983]
MapQaTorは、再現可能でトレース可能なマップベースのQAデータセットの作成を合理化するWebアプリケーションである。
プラグインとプレイのアーキテクチャにより、MapQaTorは任意のMap APIとシームレスに統合できる。
論文 参考訳(メタデータ) (2024-12-30T15:33:19Z) - EarthVQA: Towards Queryable Earth via Relational Reasoning-Based Remote
Sensing Visual Question Answering [11.37120215795946]
本研究では,多モードマルチタスクVQAデータセット(EarthVQA)を開発した。
EarthVQAデータセットには6000の画像、対応するセマンティックマスク、都市と農村のガバナンス要件を組み込んだ208,593のQAペアが含まれている。
本稿では,オブジェクト中心の方法でVQAを進めるためのセマンティックオブジェクト認識フレームワーク(SOBA)を提案する。
論文 参考訳(メタデータ) (2023-12-19T15:11:32Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z) - UniKGQA: Unified Retrieval and Reasoning for Solving Multi-hop Question
Answering Over Knowledge Graph [89.98762327725112]
KGQA(Multi-hop Question Answering over Knowledge Graph)は、自然言語の質問で言及されているトピックエンティティから、複数のホップを持つ回答エンティティを見つけることを目的としている。
我々は、モデルアーキテクチャとパラメータ学習の両方において、検索と推論を統合することで、マルチホップKGQAタスクの新しいアプローチであるUniKGQAを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:08:09Z) - Knowledge Base Question Answering by Case-based Reasoning over Subgraphs [81.22050011503933]
本モデルでは,既存のKG補完アルゴリズムよりも複雑な推論パターンを必要とする問合せに対して,より効果的に答えることを示す。
提案モデルは、KBQAベンチマークの最先端モデルよりも優れているか、競合的に動作する。
論文 参考訳(メタデータ) (2022-02-22T01:34:35Z) - GeoQA: A Geometric Question Answering Benchmark Towards Multimodal
Numerical Reasoning [172.36214872466707]
我々は、テキスト記述、視覚図、定理知識の包括的理解を必要とする幾何学的問題を解くことに注力する。
そこで本研究では,5,010の幾何学的問題を含む幾何学的質問応答データセットGeoQAを提案する。
論文 参考訳(メタデータ) (2021-05-30T12:34:17Z) - Geographic Question Answering: Challenges, Uniqueness, Classification,
and Future Directions [10.21626173269271]
質問回答(QA)は、自然言語で表現された質問に対する回答を生成することを目的としている。
QAシステムはまだ、地理的実体や概念に関わる質問に答えるのに苦労しています。
論文 参考訳(メタデータ) (2021-05-19T20:47:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。