論文の概要: Mobility-Embedded POIs: Learning What A Place Is and How It Is Used from Human Movement
- arxiv url: http://arxiv.org/abs/2601.21149v1
- Date: Thu, 29 Jan 2026 01:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.498788
- Title: Mobility-Embedded POIs: Learning What A Place Is and How It Is Used from Human Movement
- Title(参考訳): モビリティを組み込んだPOI:人間の動きから場所と使い方を学ぶ
- Authors: Maria Despoina Siampou, Shushman Choudhury, Shang-Ling Hsu, Neha Arora, Cyrus Shahabi,
- Abstract要約: 本稿では,大規模な人体移動データを用いた言語モデルからPOIを組み込むフレームワークであるME-POIを紹介する。
ME-POIは、個々の訪問を時間的にコンテキスト化された埋め込みとしてエンコードし、学習可能なPOI表現と整合させる。
新たに提案した5つのマップエンリッチメントタスクのME-POIを評価し,POIのアイデンティティと機能の両方をキャプチャする能力をテストする。
- 参考スコア(独自算出の注目度): 8.906820313234476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent progress in geospatial foundation models highlights the importance of learning general-purpose representations for real-world locations, particularly points-of-interest (POIs) where human activity concentrates. Existing approaches, however, focus primarily on place identity derived from static textual metadata, or learn representations tied to trajectory context, which capture movement regularities rather than how places are actually used (i.e., POI's function). We argue that POI function is a missing but essential signal for general POI representations. We introduce Mobility-Embedded POIs (ME-POIs), a framework that augments POI embeddings derived, from language models with large-scale human mobility data to learn POI-centric, context-independent representations grounded in real-world usage. ME-POIs encodes individual visits as temporally contextualized embeddings and aligns them with learnable POI representations via contrastive learning to capture usage patterns across users and time. To address long-tail sparsity, we propose a novel mechanism that propagates temporal visit patterns from nearby, frequently visited POIs across multiple spatial scales. We evaluate ME-POIs on five newly proposed map enrichment tasks, testing its ability to capture both the identity and function of POIs. Across all tasks, augmenting text-based embeddings with ME-POIs consistently outperforms both text-only and mobility-only baselines. Notably, ME-POIs trained on mobility data alone can surpass text-only models on certain tasks, highlighting that POI function is a critical component of accurate and generalizable POI representations.
- Abstract(参考訳): 地理空間基盤モデルの最近の進歩は、現実世界の場所、特に人間の活動が集中する関心のポイント(POI)について、汎用的な表現を学ぶことの重要性を強調している。
しかし、既存のアプローチは、静的なテキストメタデータから派生した場所の同一性や、実際の場所(POIの関数)ではなく運動規則をキャプチャするトラジェクトリコンテキストに関連する表現に重点を置いている。
POI 関数は一般の POI 表現に欠落しているが必須の信号であると主張する。
我々は、大規模な人体移動データを持つ言語モデルからPOIを組み込んだフレームワークであるME-POIを導入し、実世界の利用に根ざしたPOI中心の文脈に依存しない表現を学習する。
ME-POIは、個々の訪問を時間的にコンテキスト化された埋め込みとしてエンコードし、対照的な学習を通じて学習可能なPOI表現と整合させ、ユーザと時間間での使用パターンをキャプチャする。
長距離の空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的空間的
新たに提案した5つのマップエンリッチメントタスクのME-POIを評価し,POIのアイデンティティと機能の両方をキャプチャする能力をテストする。
全てのタスクにおいて、ME-POIによるテキストベースの埋め込みの強化は、テキストのみのベースラインとモビリティのみのベースラインを一貫して上回る。
特に、モビリティデータだけで訓練されたME-POIは、特定のタスクにおけるテキストのみのモデルを上回ることができ、POI関数が正確で一般化可能なPOI表現の重要なコンポーネントであることを強調している。
関連論文リスト
- Foundation Model for Skeleton-Based Human Action Understanding [56.89025287217221]
本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文 参考訳(メタデータ) (2025-08-18T02:42:16Z) - On The Role of Pretrained Language Models in General-Purpose Text Embeddings: A Survey [39.840208834931076]
汎用テキスト埋め込み(GPTE)は、リッチで転送可能な表現を生成する能力によって、大きな注目を集めている。
プレトレーニング言語モデル(PLM)の時代におけるGPTEの概要について概観する。
我々は,多言語サポート,マルチモーダル統合,コード理解,シナリオ固有の適応など,PLMによって実現される高度な役割について述べる。
論文 参考訳(メタデータ) (2025-07-28T12:52:24Z) - POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution [3.729614737011418]
textsfPOIFormerは、正確で効率的なPOI属性のためのトランスフォーマーベースの新しいフレームワークである。
textsfPOIFormerは、大規模でノイズの多いモビリティデータセットにおいて、正確で効率的な属性を可能にする。
論文 参考訳(メタデータ) (2025-07-12T04:37:52Z) - LPO: Towards Accurate GUI Agent Interaction via Location Preference Optimization [58.65395773049273]
位置優先最適化(Location Preference Optimization、LPO)は、位置データを利用してインタラクションの好みを最適化する新しいアプローチである。
LPOは情報エントロピーを使用して、情報に富んだゾーンに注目して相互作用位置を予測する。
私たちのコードは間もなくhttps://github.com/AIDC-AI/LPO.comで公開されます。
論文 参考訳(メタデータ) (2025-06-11T03:43:30Z) - Geography-Aware Large Language Models for Next POI Recommendation [21.03555605703108]
Next Point-of-Interest(POI)レコメンデーションタスクは,過去の移動データに基づいてユーザの次の目的地を予測することを目的としている。
GA-LLM(Geography-Aware Large Language Model)は,2つの特殊なコンポーネントを持つ大規模言語モデルを強化する新しいフレームワークである。
3つの実世界のデータセットの実験は、GA-LLMの最先端性能を実証している。
論文 参考訳(メタデータ) (2025-05-18T03:20:20Z) - POI-Enhancer: An LLM-based Semantic Enhancement Framework for POI Representation Learning [34.93661259065691]
近年の研究では、多モーダル情報によるPOI表現の充実がタスク性能を大幅に向上させることが示されている。
広範なテキストデータに基づいて訓練された大規模言語モデル (LLMs) は、リッチテキストの知識を持つことがわかった。
古典的なPOI学習モデルによって生成されたPOI表現を改善するために,LLMを利用するポータブルフレームワークであるPOI-Enhancerを提案する。
論文 参考訳(メタデータ) (2025-02-14T09:34:24Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。