論文の概要: POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution
- arxiv url: http://arxiv.org/abs/2507.09137v1
- Date: Sat, 12 Jul 2025 04:37:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:22.55199
- Title: POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution
- Title(参考訳): POIFormer: 正確でスケーラブルなポイントオブインタートリビューションのためのトランスフォーマーベースのフレームワーク
- Authors: Nripsuta Ani Saxena, Shang-Ling Hsu, Mehul Shetty, Omar Alkhadra, Cyrus Shahabi, Abigail L. Horn,
- Abstract要約: textsfPOIFormerは、正確で効率的なPOI属性のためのトランスフォーマーベースの新しいフレームワークである。
textsfPOIFormerは、大規模でノイズの多いモビリティデータセットにおいて、正確で効率的な属性を可能にする。
- 参考スコア(独自算出の注目度): 3.729614737011418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurately attributing user visits to specific Points of Interest (POIs) is a foundational task for mobility analytics, personalized services, marketing and urban planning. However, POI attribution remains challenging due to GPS inaccuracies, typically ranging from 2 to 20 meters in real-world settings, and the high spatial density of POIs in urban environments, where multiple venues can coexist within a small radius (e.g., over 50 POIs within a 100-meter radius in dense city centers). Relying on proximity is therefore often insufficient for determining which POI was actually visited. We introduce \textsf{POIFormer}, a novel Transformer-based framework for accurate and efficient POI attribution. Unlike prior approaches that rely on limited spatiotemporal, contextual, or behavioral features, \textsf{POIFormer} jointly models a rich set of signals, including spatial proximity, visit timing and duration, contextual features from POI semantics, and behavioral features from user mobility and aggregated crowd behavior patterns--using the Transformer's self-attention mechanism to jointly model complex interactions across these dimensions. By leveraging the Transformer to model a user's past and future visits (with the current visit masked) and incorporating crowd-level behavioral patterns through pre-computed KDEs, \textsf{POIFormer} enables accurate, efficient attribution in large, noisy mobility datasets. Its architecture supports generalization across diverse data sources and geographic contexts while avoiding reliance on hard-to-access or unavailable data layers, making it practical for real-world deployment. Extensive experiments on real-world mobility datasets demonstrate significant improvements over existing baselines, particularly in challenging real-world settings characterized by spatial noise and dense POI clustering.
- Abstract(参考訳): 特定の関心のポイント(POI)への正確な訪問は、モビリティ分析、パーソナライズされたサービス、マーケティング、都市計画の基本的なタスクである。
しかし、GPSの不正確さによりPOIの帰属は依然として困難であり、現実の環境では2~20m、都市環境では複数の場所が小さな半径内で共存できるPOIの空間密度が高い(例えば、密集都市中心部では100mの範囲内50POI以上)。
したがって、どのPOIが実際に訪れたかを判断するには、近接して考えることが不十分であることが多い。
正確かつ効率的なPOI帰属のためのトランスフォーマーベースの新しいフレームワークである \textsf{POIFormer} を紹介する。
限られた時空間的、文脈的、行動的特徴に依存する以前のアプローチとは異なり、 \textsf{POIFormer} は、空間的近接、訪問タイミングと期間、POIセマンティクスからのコンテキスト的特徴、ユーザモビリティと集約された群衆の行動パターンからの行動的特徴を含む、豊富な信号のセットを共同でモデル化する。
Transformerを利用して、ユーザの過去と将来の訪問(現在の訪問はマスク付き)をモデル化し、事前計算されたKDEを通じてクラウドレベルの行動パターンを組み込むことで、大きなノイズの多いモビリティデータセットにおいて、正確で効率的な帰属を可能にする。
そのアーキテクチャは、多様なデータソースと地理的コンテキストをまたいだ一般化をサポートし、アクセスし難いデータレイヤや利用できないデータレイヤへの依存を回避し、現実世界のデプロイに実用的である。
実世界のモビリティデータセットに関する大規模な実験は、特に空間ノイズと密集したPOIクラスタリングを特徴とする現実の環境において、既存のベースラインよりも大幅に改善されている。
関連論文リスト
- LPO: Towards Accurate GUI Agent Interaction via Location Preference Optimization [58.65395773049273]
位置優先最適化(Location Preference Optimization、LPO)は、位置データを利用してインタラクションの好みを最適化する新しいアプローチである。
LPOは情報エントロピーを使用して、情報に富んだゾーンに注目して相互作用位置を予測する。
私たちのコードは間もなくhttps://github.com/AIDC-AI/LPO.comで公開されます。
論文 参考訳(メタデータ) (2025-06-11T03:43:30Z) - MobCLIP: Learning General-purpose Geospatial Representation at Scale [0.7224497621488285]
全国初の汎用位置情報エンコーダであるMobCLIPについて紹介する。
新たなCLIPベースのアーキテクチャを採用することで、1億以上のPOI、全国的なリモートセンシング画像、および10億のエッジモビリティグラフによる構造化された人口統計を調整できる。
我々は,MobCLIPが最先端モデルよりも平均35%優れた汎用予測性能を実現することを示した。
論文 参考訳(メタデータ) (2025-06-02T04:14:03Z) - Mixture-of-Experts for Personalized and Semantic-Aware Next Location Prediction [20.726107072683575]
NextLocMoEは、大きな言語モデル(LLM)上に構築され、デュアルレベルのMixture-of-Experts(MoE)設計を中心に構築された、新しいフレームワークである。
我々のアーキテクチャは2つの特別なモジュールで構成されている: ロケーションセマンティックス MoE は、位置の豊富な機能的意味をエンコードする埋め込みレベルで動作し、パーソナライズされた MoE は、トランスフォーマーのバックボーンに埋め込まれ、個々のユーザーモビリティパターンに動的に適応する。
論文 参考訳(メタデータ) (2025-05-30T13:45:19Z) - Geography-Aware Large Language Models for Next POI Recommendation [21.03555605703108]
Next Point-of-Interest(POI)レコメンデーションタスクは,過去の移動データに基づいてユーザの次の目的地を予測することを目的としている。
GA-LLM(Geography-Aware Large Language Model)は,2つの特殊なコンポーネントを持つ大規模言語モデルを強化する新しいフレームワークである。
3つの実世界のデータセットの実験は、GA-LLMの最先端性能を実証している。
論文 参考訳(メタデータ) (2025-05-18T03:20:20Z) - PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-02-21T09:57:53Z) - Rethinking Urban Mobility Prediction: A Super-Multivariate Time Series
Forecasting Approach [71.67506068703314]
長期の都市移動予測は、都市施設やサービスの効果的管理において重要な役割を担っている。
伝統的に、都市移動データはビデオとして構成され、経度と緯度を基本的なピクセルとして扱う。
本研究では,都市におけるモビリティ予測の新たな視点について紹介する。
都市移動データを従来のビデオデータとして単純化するのではなく、複雑な時系列と見なす。
論文 参考訳(メタデータ) (2023-12-04T07:39:05Z) - Revisiting Mobility Modeling with Graph: A Graph Transformer Model for
Next Point-of-Interest Recommendation [9.863982037173443]
Next Point-of-Interest (POI)レコメンデーションは、都市モビリティの応用において重要な役割を担っている。
textbfunderlineMobility textbfunderlineGraph textbfunderlineTransformer (MobGT)を提案する。
MobGTにより、グラフを完全に活用して、ユーザのモビリティパターンの空間的特徴と時間的特徴の両方をキャプチャすることができます。
論文 参考訳(メタデータ) (2023-10-02T14:11:16Z) - Self-supervised Graph-based Point-of-interest Recommendation [66.58064122520747]
Next Point-of-Interest (POI)レコメンデーションは、ロケーションベースのeコマースにおいて重要なコンポーネントとなっている。
自己教師付きグラフ強化POIレコメンデーション(S2GRec)を次のPOIレコメンデーションのために提案する。
特に,グローバル・トランジション・グラフと局所軌道グラフの両方からの協調的な信号を組み込むために,グラフ強化セルフアテンテート・レイヤを考案した。
論文 参考訳(メタデータ) (2022-10-22T17:29:34Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - Masked Transformer for Neighhourhood-aware Click-Through Rate Prediction [74.52904110197004]
本稿では,近隣相互作用に基づくCTR予測を提案し,そのタスクを異種情報ネットワーク(HIN)設定に組み込む。
周辺地域の表現を高めるために,ノード間のトポロジカルな相互作用を4種類検討する。
本研究では,2つの実世界のデータセットに関する総合的な実験を行い,提案手法が最先端のCTRモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-01-25T12:44:23Z) - Modelling of Bi-directional Spatio-Temporal Dependence and Users'
Dynamic Preferences for Missing POI Check-in Identification [38.51964956686177]
双方向の時間的依存とユーザの動的嗜好を統合するモデルであるBi-STDDPを開発した。
その結果, 最先端手法と比較して, モデルの大幅な改善が示された。
論文 参考訳(メタデータ) (2021-12-31T03:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。