論文の概要: Much of Geospatial Web Search Is Beyond Traditional GIS
- arxiv url: http://arxiv.org/abs/2605.11336v1
- Date: Mon, 11 May 2026 23:42:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.48146
- Title: Much of Geospatial Web Search Is Beyond Traditional GIS
- Title(参考訳): 地理空間Web検索のほとんどが従来のGISを超えている
- Authors: Ilya Ilyankou, Stefano Cavazzi, James Haworth,
- Abstract要約: 我々は,1100万の実BingクエリからなるMS MARCOコーパスに,高密度文埋め込み,軽量なSetFit分類器,および密度に基づくクラスタリングを適用した。
181,827の地理空間的クエリ(18.0%)を識別し、元のアノテーションでは6.17%とラベル付けされた6.17%をほぼ3倍にしている。
88のクエリーカテゴリーの分類結果から、地理空間検索はトランザクション的および実践的な検索によって支配されていることが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web search queries concern place far more often than existing labelling schemes suggest, yet the landscape of geospatial web search queries - what people ask of place, and how often - remains poorly characterised at scale. We apply dense sentence embeddings, a lightweight SetFit classifier, and density-based clustering to the full MS MARCO corpus of 1.01 million real Bing queries without prior filtering for toponyms or spatial keywords, identifying 181,827 geospatial queries (18.0%), nearly threefold the 6.17% labelled as Location in the original annotations. The resulting taxonomy of 88 query categories reveals that geospatial web search is dominated by transactional and practical lookups: costs and prices alone account for 15.3% of geospatial queries, nearly twice the size of the entire physical geography theme. Much of this activity - costs, opening hours, contact details, weather, travel recommendations - falls outside the scope traditional GIS systems and knowledge graphs are built to serve. The categories vary substantially in the kind of answer they admit, from deterministic lookups answerable from spatial databases or knowledge graphs to evaluative or temporally volatile queries that require generative or real-time systems. We discuss implications for hybrid retrieval architectures and for benchmarks of geographic reasoning in large language models. We openly release the labelled dataset, classifier, and taxonomy.
- Abstract(参考訳): Web検索クエリに関する懸念は、既存のラベル付け方式よりもはるかに頻繁に発生しますが、地理空間的なWeb検索クエリの状況 — 場所を問うものや頻度 – は、いまだに大規模にあまり特徴付けられていないままです。
従来のアノテーションでは181,827個の地理空間的クエリ(18.0%)を識別し,約3倍の6.17%をLocationとラベル付けした。
88のクエリーカテゴリーの分類結果から、地理空間的ウェブサーチはトランザクションと実践的なルックアップによって支配されていることが判明した。
コスト、オープニング時間、連絡先の詳細、天気、旅行推奨といったこの活動の多くは、従来のGISシステムや知識グラフが機能する範囲外にあります。
カテゴリは、空間データベースや知識グラフから答えられる決定論的ルックアップから、生成的またはリアルタイムシステムを必要とする評価的または時間的変動的なクエリまで、彼らが認める答えの種類によって大きく異なる。
本稿では,ハイブリッド検索アーキテクチャと大規模言語モデルにおける地理的推論のベンチマークについて論じる。
ラベル付きデータセット、分類器、分類器をオープンにリリースします。
関連論文リスト
- Georeferencing complex relative locality descriptions with large language models [1.9911463513783276]
本稿では,局所性記述を自動的にジオレファレンスする大規模言語モデルの可能性について検討する。
最初に有効なプロンプトパターンを特定し,生物多様性データセット上での量子化低ランク適応(QLoRA)を用いてLLMを微調整した。
われわれのアプローチは、データセットを平均して、半径10km以内のレコードの65%を一定のトレーニングデータとして、既存のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-12-16T09:27:02Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T03:05:12Z) - SE-KGE: A Location-Aware Knowledge Graph Embedding Model for Geographic
Question Answering and Spatial Semantic Lifting [9.949690056661218]
位置認識型KG埋め込みモデルSE-KGEを提案する。
点座標や地理的実体の境界ボックスなどの空間情報をKG埋め込み空間にエンコードする。
また、SE-KGEの性能を評価するために、地理知識グラフと、DBGeoと呼ばれる地理的問合せ対のセットを構築した。
論文 参考訳(メタデータ) (2020-04-25T17:46:31Z) - Semantically-Enriched Search Engine for Geoportals: A Case Study with
ArcGIS Online [7.005838154484841]
本稿では,Lucene-based technique を用いた地理ポータルのためのセマンティック・エンリッチな検索エンジンを提案する。
提案するフレームワークを評価するために,ベンチマークデータセットを構築した。
評価の結果,提案するセマンティッククエリ拡張フレームワークは,ユーザの検索意図を捉えるのに非常に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-03-14T06:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。