論文の概要: A Multi-Modal Geographic Pre-Training Method
- arxiv url: http://arxiv.org/abs/2301.04283v1
- Date: Wed, 11 Jan 2023 03:05:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 14:37:14.992836
- Title: A Multi-Modal Geographic Pre-Training Method
- Title(参考訳): マルチモーダル地理事前学習法
- Authors: Ruixue Ding, Boli Chen, Pengjun Xie, Fei Huang, Xin Li, Qiang Zhang,
Yao Xu
- Abstract要約: マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
- 参考スコア(独自算出の注目度): 49.78466122982627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a core task in location-based services (LBS) (e.g., navigation maps),
query and point of interest (POI) matching connects users' intent with
real-world geographic information. Recently, pre-trained models (PTMs) have
made advancements in many natural language processing (NLP) tasks. Generic
text-based PTMs do not have enough geographic knowledge for query-POI matching.
To overcome this limitation, related literature attempts to employ
domain-adaptive pre-training based on geo-related corpus. However, a query
generally contains mentions of multiple geographic objects, such as nearby
roads and regions of interest (ROIs). The geographic context (GC), i.e., these
diverse geographic objects and their relationships, is therefore pivotal to
retrieving the most relevant POI. Single-modal PTMs can barely make use of the
important GC and therefore have limited performance. In this work, we propose a
novel query-POI matching method Multi-modal Geographic language model (MGeo),
which comprises a geographic encoder and a multi-modal interaction module. MGeo
represents GC as a new modality and is able to fully extract multi-modal
correlations for accurate query-POI matching. Besides, there is no publicly
available benchmark for this topic. In order to facilitate further research, we
build a new open-source large-scale benchmark Geographic TExtual Similarity
(GeoTES). The POIs come from an open-source geographic information system
(GIS). The queries are manually generated by annotators to prevent privacy
issues. Compared with several strong baselines, the extensive experiment
results and detailed ablation analyses on GeoTES demonstrate that our proposed
multi-modal pre-training method can significantly improve the query-POI
matching capability of generic PTMs, even when the queries' GC is not provided.
Our code and dataset are publicly available at
https://github.com/PhantomGrapes/MGeo.
- Abstract(参考訳): 位置情報ベースのサービス(LBS)における中核的なタスク(ナビゲーションマップ、クエリと関心点(POI)マッチング)は、ユーザの意図を現実世界の地理情報と結びつける。
近年,多くの自然言語処理(NLP)タスクにおいて,事前学習モデル(PTM)が進歩している。
ジェネリックテキストベースのPTMは、クエリ-POIマッチングに十分な地理的知識を持っていない。
この制限を克服するため、関連文献は、地理関連コーパスに基づいたドメイン適応型事前学習を試みている。
しかし、クエリは一般に、近くの道路や関心のある地域(ROI)など、複数の地理的対象の言及を含んでいる。
地理的文脈(gc)、すなわちこれらの多様な地理的対象とその関係は、最も関連するpoiを取得する上で重要である。
シングルモーダルPTMは重要なGCをほとんど利用できないため、パフォーマンスが制限される。
本研究では,ジオグラフィックエンコーダとマルチモーダルインタラクションモジュールを組み合わせた,新しいクエリ-POIマッチング手法であるMulti-modal Geographic Language Model (MGeo)を提案する。
MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。
さらに、このトピックのベンチマークは公開されていない。
さらなる研究を促進するため,オープンソースの大規模ベンチマークであるGeoTES(GeoTES)を構築した。
POIは、オープンソースの地理情報システム(GIS)に由来する。
クエリは、プライバシの問題を防ぐために、アノテーションによって手動で生成される。
いくつかの強力なベースラインと比較すると,geteの広範な実験結果と詳細なアブレーション解析により,提案手法は,クエリのgcが提供されていなくても,ジェネリックptmsのクエリ-poiマッチング能力を大幅に向上できることを示した。
私たちのコードとデータセットはhttps://github.com/PhantomGrapes/MGeo.comで公開されています。
関連論文リスト
- Geo-FuB: A Method for Constructing an Operator-Function Knowledge Base for Geospatial Code Generation Tasks Using Large Language Models [0.5242869847419834]
本研究では,地理空間記述のセマンティクスを活用して,そのような知識基盤を構築するためのフレームワークを提案する。
サンプルの知識ベースであるGeo-FuBは154,075のGoogle Earth Engineスクリプトで構築されており、GitHubで公開されている。
論文 参考訳(メタデータ) (2024-10-28T12:50:27Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。
我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。
実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文 参考訳(メタデータ) (2023-10-10T00:03:23Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese
Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。
そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文 参考訳(メタデータ) (2023-09-04T13:44:50Z) - GeoGPT: Understanding and Processing Geospatial Tasks through An
Autonomous GPT [6.618846295332767]
GISの意思決定者は、空間的タスクを解決するために、一連の空間的アルゴリズムと演算を組み合わせる必要がある。
我々は,地理空間データ収集,処理,解析を自律的に行うことのできるGeoGPTと呼ばれる新しいフレームワークを開発した。
論文 参考訳(メタデータ) (2023-07-16T03:03:59Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - Semantically-Enriched Search Engine for Geoportals: A Case Study with
ArcGIS Online [7.005838154484841]
本稿では,Lucene-based technique を用いた地理ポータルのためのセマンティック・エンリッチな検索エンジンを提案する。
提案するフレームワークを評価するために,ベンチマークデータセットを構築した。
評価の結果,提案するセマンティッククエリ拡張フレームワークは,ユーザの検索意図を捉えるのに非常に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-03-14T06:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。