Fugu-MT 論文翻訳(概要): Geolocation Representation from Large Language Models are Generic Enhancers for Spatio-Temporal Learning

論文の概要: Geolocation Representation from Large Language Models are Generic Enhancers for Spatio-Temporal Learning

arxiv url: http://arxiv.org/abs/2408.12116v1
Date: Thu, 22 Aug 2024 04:05:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-23 15:13:16.524730
Title: Geolocation Representation from Large Language Models are Generic Enhancers for Spatio-Temporal Learning
Title（参考訳）: 時空間学習のためのジェネリックエンハンスである大規模言語モデルからのジオロケーション表現
Authors: Junlin He, Tong Nie, Wei Ma,
Abstract要約: 普遍表現モデルは、自然言語処理やコンピュータビジョンで広く使われているよりも一般的ではない。この相違は主に入力された既存の表現モデルに関連する高コストから生じる。本研究では,大規模言語モデルを用いて位置情報表現を導出する学習自由手法を開発した。
参考スコア（独自算出の注目度）: 10.438284728725842
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the geospatial domain, universal representation models are significantly less prevalent than their extensive use in natural language processing and computer vision. This discrepancy arises primarily from the high costs associated with the input of existing representation models, which often require street views and mobility data. To address this, we develop a novel, training-free method that leverages large language models (LLMs) and auxiliary map data from OpenStreetMap to derive geolocation representations (LLMGeovec). LLMGeovec can represent the geographic semantics of city, country, and global scales, which acts as a generic enhancer for spatio-temporal learning. Specifically, by direct feature concatenation, we introduce a simple yet effective paradigm for enhancing multiple spatio-temporal tasks including geographic prediction (GP), long-term time series forecasting (LTSF), and graph-based spatio-temporal forecasting (GSTF). LLMGeovec can seamlessly integrate into a wide spectrum of spatio-temporal learning models, providing immediate enhancements. Experimental results demonstrate that LLMGeovec achieves global coverage and significantly boosts the performance of leading GP, LTSF, and GSTF models.
Abstract（参考訳）: 地理空間領域では、普遍表現モデルは自然言語処理やコンピュータビジョンにおいて広く使われるよりもはるかに少ない。この相違は主に、しばしばストリートビューやモビリティデータを必要とする既存の表現モデルの入力に伴う高コストから生じる。そこで我々は,大規模言語モデル(LLM)とOpenStreetMapからの補助地図データを利用して位置情報表現(LLMGeovec)を導出する,新しい学習自由な手法を開発した。 LLMGeovecは、時空間学習のための一般的なエンハンサーとして機能する都市、国、グローバルスケールの地理的意味論を表現することができる。具体的には,地理的予測 (GP), 長期時系列予測 (LTSF), グラフベースの時空間予測 (GSTF) など,複数の時空間的タスクをシンプルかつ効果的に拡張するパラダイムを導入する。 LLMGeovecは、幅広い時空間学習モデルにシームレスに統合することができ、即時的な拡張を提供する。実験結果から,LLMGeovecはGP,LTSF,GSTFモデルの性能を大幅に向上することが示された。

関連論文リスト

PlaceFM: A Training-free Geospatial Foundation Model of Places using Large-Scale Point of Interest Data [0.5735035463793009]
PlaceFMは、トレーニング不要のクラスタリングベースのアプローチを通じて、プレース表現をキャプチャする。 placeFMは、米国Foursquareのデータから構築された関心グラフの全点をまとめたものだ。 placeFMは、興味のある場所を自動的に識別しながら、汎用的な領域埋め込みを生成する。 placeFMは、大規模POIグラフ上の領域レベルの表現を生成する際に、最大100倍のスピードアップを達成する。
論文参考訳（メタデータ） (2025-06-25T15:10:31Z)
Geography-Aware Large Language Models for Next POI Recommendation [21.03555605703108]
Next Point-of-Interest(POI)レコメンデーションタスクは,過去の移動データに基づいてユーザの次の目的地を予測することを目的としている。 GA-LLM(Geography-Aware Large Language Model)は,2つの特殊なコンポーネントを持つ大規模言語モデルを強化する新しいフレームワークである。 3つの実世界のデータセットの実験は、GA-LLMの最先端性能を実証している。
論文参考訳（メタデータ） (2025-05-18T03:20:20Z)
OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。地理空間応用に適したMLLM(OmniGeo)を提案する。自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文参考訳（メタデータ） (2025-03-20T16:45:48Z)
GeoJEPA: Towards Eliminating Augmentation- and Sampling Bias in Multimodal Geospatial Learning [0.0]
自己教師型統合埋め込み予測アーキテクチャ上に構築された地理空間データのための多目的多モード融合モデルであるGeoJEPAを提案する。我々は,自己教師付き地理空間表現学習において広く受け入れられている増分とサンプリングバイアスを排除することを目的としている。その結果,都市域のマルチモーダルな意味表現と,定量的かつ質的に評価するマップエンティティが得られた。
論文参考訳（メタデータ） (2025-02-25T22:03:28Z)
GeoAggregator: An Efficient Transformer Model for Geo-Spatial Tabular Data [5.40483645224129]
本稿では地理空間データモデリングのための効率的かつ軽量なアルゴリズムGeoAggregatorを紹介する。我々は、空間統計モデル、XGBoost、およびいくつかの最先端地理空間深層学習法と比較した。その結果、GeoAggregatorsは、ほぼすべてのデータセットで競合相手と比較して、ベストまたはセカンドベストのパフォーマンスを達成した。
論文参考訳（メタデータ） (2025-02-20T20:39:15Z)
Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。その結果,本手法は現在の最先端手法よりも優れていた。
論文参考訳（メタデータ） (2024-08-21T03:31:30Z)
Image-Based Geolocation Using Large Vision-Language Models [19.071551941682063]
画像に基づく位置情報の精度を大幅に向上する革新的なフレームワークであるToolを紹介した。ツールは体系的なチェーン・オブ・シント(CoT)アプローチを採用し、人間のジオゲスティング戦略を模倣する。 GeoGuessrゲームの平均スコアは4550.5で85.37%で、高精度な位置情報予測を行う。
論文参考訳（メタデータ） (2024-08-18T13:39:43Z)
Geode: A Zero-shot Geospatial Question-Answering Agent with Explicit Reasoning and Precise Spatio-Temporal Retrieval [0.0]
本研究では,ゼロショット地理空間的質問応答タスクを高精度に処理するための先駆的システムを提案する。当社のアプローチは,現在の大規模言語モデルの限界に対処する上で,大幅な改善を図っている。
論文参考訳（メタデータ） (2024-06-26T21:59:54Z)
WorldGPT: Empowering LLM as Multimodal World Model [51.243464216500975]
MLLM(Multimodal Large Language Model)に基づく汎用世界モデルWorldGPTを紹介する。 WorldGPTは、さまざまなドメインにまたがる数百万のビデオを分析して、世界ダイナミクスの理解を得る。マルチモーダル状態遷移予測ベンチマークWorldNetの評価を行う。
論文参考訳（メタデータ） (2024-04-28T14:42:02Z)
GeoLLM: Extracting Geospatial Knowledge from Large Language Models [49.20315582673223]
大規模言語モデルから地理空間的知識を効果的に抽出する新しい手法であるGeoLLMを提案する。我々は、人口密度や経済生活の計測など、国際社会への関心の中心となる複数の課題にまたがるアプローチの有用性を実証する。実験の結果, LLMは試料効率が高く, 地理空間情報に富み, 世界中のロバストであることがわかった。
論文参考訳（メタデータ） (2023-10-10T00:03:23Z)
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文参考訳（メタデータ） (2023-09-27T20:54:56Z)
Geo-Encoder: A Chunk-Argument Bi-Encoder Framework for Chinese Geographic Re-Ranking [61.60169764507917]
中国の地理的再ランクタスクは、検索された候補者の中で最も関連性の高い住所を見つけることを目的としている。そこで我々は,中国語の地理的意味論をより効果的に統合する,革新的なフレームワークであるGeo-Encoderを提案する。
論文参考訳（メタデータ） (2023-09-04T13:44:50Z)
GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.23141626803287]
地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。まず,地理的適応のための大規模データセットGeoNetを紹介する。第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文参考訳（メタデータ） (2023-03-27T17:59:34Z)
MGeo: Multi-Modal Geographic Pre-Training Method [49.78466122982627]
マルチモーダルジオグラフィック言語モデル(MGeo)を提案する。 MGeoはGCを新しいモダリティとして表現し、正確なクエリ-POIマッチングのためのマルチモーダル相関を完全に抽出することができる。提案するマルチモーダル事前学習法は,汎用PTMのクエリ-POIマッチング能力を大幅に向上させることができる。
論文参考訳（メタデータ） (2023-01-11T03:05:12Z)
A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文参考訳（メタデータ） (2022-11-04T09:58:57Z)
Geographic Adaptation of Pretrained Language Models [29.81557992080902]
マルチタスク学習環境において,言語モデリングと位置情報予測を併用する中間学習ステップであるジオアダプテーションを導入する。ジオアダプテーションの有効性は、事前訓練された言語モデルの表現空間を地理的に再現する能力に起因していることを示す。
論文参考訳（メタデータ） (2022-03-16T11:55:00Z)
Multi-Level Graph Convolutional Network with Automatic Graph Learning for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。 MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文参考訳（メタデータ） (2020-09-19T09:26:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。