論文の概要: PlaceFM: A Training-free Geospatial Foundation Model of Places using Large-Scale Point of Interest Data
- arxiv url: http://arxiv.org/abs/2507.02921v2
- Date: Thu, 02 Oct 2025 13:01:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 21:54:12.759181
- Title: PlaceFM: A Training-free Geospatial Foundation Model of Places using Large-Scale Point of Interest Data
- Title(参考訳): PlaceFM: 大規模関心点データを用いた場所の訓練不要な地理空間基盤モデル
- Authors: Mohammad Hashemi, Hossein Amiri, Andreas Zufle,
- Abstract要約: PlaceFMは、トレーニング不要のクラスタリングベースのアプローチを通じて、プレース表現をキャプチャする。
placeFMは、米国Foursquareのデータから構築された関心グラフの全点をまとめたものだ。
placeFMは、興味のある場所を自動的に識別しながら、汎用的な領域埋め込みを生成する。
placeFMは、大規模POIグラフ上の領域レベルの表現を生成する際に、最大100倍のスピードアップを達成する。
- 参考スコア(独自算出の注目度): 0.5735035463793009
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid growth and continual updates of geospatial data from diverse sources, geospatial foundation model pre-training for urban representation learning has emerged as a key research direction for advancing data-driven urban planning. Spatial structure is fundamental to effective geospatial intelligence systems; however, existing foundation models often lack the flexibility to reason about places, context-rich regions spanning multiple spatial granularities that may consist of many spatially and semantically related points of interest. To address this gap, we propose PlaceFM, a geospatial foundation model that captures place representations through a training-free, clustering-based approach. PlaceFM summarizes the entire point of interest graph constructed from U.S. Foursquare data, producing general-purpose region embeddings while automatically identifying places of interest. These embeddings can be directly integrated into geolocation data pipelines to support a variety of urban downstream tasks. Without the need for costly pre-training, PlaceFM provides a scalable and efficient solution for multi-granular geospatial analysis. Extensive experiments on two real-world prediction tasks, ZIP code-level population density and housing prices, demonstrate that PlaceFM not only outperforms most state-of-the-art graph-based geospatial foundation models but also achieves up to a 100x speedup in generating region-level representations on large-scale POI graphs. The implementation is available at https://github.com/mohammadhashemii/PlaceFM.
- Abstract(参考訳): 多様な情報源からの地理空間データの急速な成長と継続的な更新により、都市表現学習のための地理空間基盤モデルの事前学習が、データ駆動型都市計画の推進の鍵となる研究方向として浮上してきた。
空間構造は効果的な地理空間インテリジェンスシステムの基本であるが、既存の基盤モデルは、多くの空間的および意味的関連点からなる複数の空間的粒度にまたがる、場所を推論する柔軟性に欠けることが多い。
そこで我々はPlaceFMを提案する。PlaceFMは地理空間的基礎モデルであり,位置表現を学習不要のクラスタリングに基づくアプローチでキャプチャする。
PlaceFMは、米国Foursquareのデータから構築された関心グラフの全点を要約し、興味のある場所を自動的に識別しながら、汎用的な地域埋め込みを生成する。
これらの埋め込みは、さまざまな都市下流タスクをサポートするために、ジオロケーションデータパイプラインに直接統合することができる。
コストのかかる事前トレーニングを必要とせずに、PlaceFMは、マルチグラニュラ地理空間解析のためのスケーラブルで効率的なソリューションを提供する。
実世界の2つの予測タスク(ZIPコードレベル人口密度と住宅価格)に関する大規模な実験により、PlaceFMは、最先端のグラフベースの地理空間基盤モデルよりも優れているだけでなく、大規模POIグラフ上での地域レベルの表現を生成する際の最大100倍の高速化も達成している。
実装はhttps://github.com/mohammadhashemii/PlaceFMで公開されている。
関連論文リスト
- GeoDistill: Geometry-Guided Self-Distillation for Weakly Supervised Cross-View Localization [70.65458151146767]
クロスビューのローカライゼーションは、自律ナビゲーションや拡張現実のような大規模な屋外アプリケーションにとって不可欠である。
既存の手法は、しばしば完全に教師付き学習に依存している。
本研究では,FoV(Field-of-View)ベースのマスキングを用いた教師学習フレームワークGeoDistillを提案する。
論文 参考訳(メタデータ) (2025-07-15T03:00:15Z) - Geographical Context Matters: Bridging Fine and Coarse Spatial Information to Enhance Continental Land Cover Mapping [2.9212099078191756]
BRIDGE-LCは,土地被覆分類プロセスに大規模地理空間情報を統合する,新しい深層学習フレームワークである。
その結果,地理空間情報の統合により土地被覆マッピング性能が向上することが示唆された。
論文 参考訳(メタデータ) (2025-04-16T17:42:46Z) - LocDiffusion: Identifying Locations on Earth by Diffusing in the Hilbert Space [10.342723428164412]
画像ジオローカライズのためのメカニズムとして拡散を利用する手法を提案する。
拡散における問題のある多様体再生成のステップを避けるため,我々は新しい球面位置符号化・復号化フレームワークを開発した。
我々は、画像の誘導の下で位置を生成するLocDiffusionと呼ばれる条件付き潜伏拡散モデルを訓練する。
論文 参考訳(メタデータ) (2025-03-23T17:15:26Z) - OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。
地理空間応用に適したMLLM(OmniGeo)を提案する。
自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文 参考訳(メタデータ) (2025-03-20T16:45:48Z) - GeoJEPA: Towards Eliminating Augmentation- and Sampling Bias in Multimodal Geospatial Learning [0.0]
自己教師型統合埋め込み予測アーキテクチャ上に構築された地理空間データのための多目的多モード融合モデルであるGeoJEPAを提案する。
我々は,自己教師付き地理空間表現学習において広く受け入れられている増分とサンプリングバイアスを排除することを目的としている。
その結果,都市域のマルチモーダルな意味表現と,定量的かつ質的に評価するマップエンティティが得られた。
論文 参考訳(メタデータ) (2025-02-25T22:03:28Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - Enhancing Worldwide Image Geolocation by Ensembling Satellite-Based Ground-Level Attribute Predictors [4.415977307120618]
本稿では,GPSなどの位置情報が存在しない場合の地上画像の位置を推定することの課題について検討する。
本稿では,推定位置分布の精度を計測する新しい指標であるリコール対エリア(Recall vs Area)を紹介する。
次に,複数の情報源からの情報を組み込んだグローバルな画像位置決め手法について検討する。
論文 参考訳(メタデータ) (2024-07-18T19:15:52Z) - City Foundation Models for Learning General Purpose Representations from OpenStreetMap [16.09047066527081]
本稿では,都市のような選択された地理的関心領域における基礎モデルをトレーニングするためのフレームワークであるCityFMを紹介する。
CityFMはOpenStreetMapからのオープンデータにのみ依存し、異なるタイプのエンティティ、空間、視覚、およびテキスト情報のマルチモーダル表現を生成する。
すべての実験において、CityFMはベースラインに匹敵する、あるいは同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-01T05:55:30Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。