論文の概要: Massive-STEPS: Massive Semantic Trajectories for Understanding POI Check-ins -- Dataset and Benchmarks
- arxiv url: http://arxiv.org/abs/2505.11239v1
- Date: Fri, 16 May 2025 13:29:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:15.088502
- Title: Massive-STEPS: Massive Semantic Trajectories for Understanding POI Check-ins -- Dataset and Benchmarks
- Title(参考訳): Massive-STEPS: POIチェックインを理解するための大規模セマンティックな軌道 -- データセットとベンチマーク
- Authors: Wilson Wongso, Hao Xue, Flora D. Salim,
- Abstract要約: 重み付きSTEPS(POIチェックイン理解のための主観的意味軌道)を提示する。
Massive-STEPSは、Semantic Trailsデータセット上に構築された、大規模で一般公開されたベンチマークデータセットである。
大規模STEPSは地理的に多様な12の都市にまたがっており、以前のデータセットよりも最新の、文化的に多様なモデルが特徴である。
- 参考スコア(独自算出の注目度): 8.789624590579903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding human mobility through Point-of-Interest (POI) recommendation is increasingly important for applications such as urban planning, personalized services, and generative agent simulation. However, progress in this field is hindered by two key challenges: the over-reliance on older datasets from 2012-2013 and the lack of reproducible, city-level check-in datasets that reflect diverse global regions. To address these gaps, we present Massive-STEPS (Massive Semantic Trajectories for Understanding POI Check-ins), a large-scale, publicly available benchmark dataset built upon the Semantic Trails dataset and enriched with semantic POI metadata. Massive-STEPS spans 12 geographically and culturally diverse cities and features more recent (2017-2018) and longer-duration (24 months) check-in data than prior datasets. We benchmarked a wide range of POI recommendation models on Massive-STEPS using both supervised and zero-shot approaches, and evaluated their performance across multiple urban contexts. By releasing Massive-STEPS, we aim to facilitate reproducible and equitable research in human mobility and POI recommendation. The dataset and benchmarking code are available at: https://github.com/cruiseresearchgroup/Massive-STEPS
- Abstract(参考訳): 都市計画、パーソナライズされたサービス、生成エージェントシミュレーションなどの応用において、POI(Point-of-Interest)レコメンデーションによる人間のモビリティの理解がますます重要になっている。
しかし、この分野の進歩は、2012-2013年の古いデータセットへの過度な依存と、さまざまなグローバルリージョンを反映した再現可能な都市レベルのチェックインデータセットの欠如という、2つの大きな課題によって妨げられている。
これらのギャップに対処するために、Semantic Trailsデータセット上に構築され、セマンティックPOIメタデータに富んだ大規模で一般公開されたベンチマークデータセットであるMassive-STEPS(Massive Semantic Trajectories for Understanding POI Check-ins)を紹介する。
Massive-STEPSは地理的および文化的に多様な12の都市にまたがっており、最近の(2017-2018)と長期(24ヶ月)のチェックインデータを備えている。
我々は、教師付きアプローチとゼロショットアプローチの両方を用いて、Massive-STEPS上で幅広いPOIレコメンデーションモデルをベンチマークし、その性能を複数の都市環境で評価した。
我々は、Massive-STEPSをリリースすることにより、人間のモビリティとPOIレコメンデーションにおける再現可能で公平な研究を促進することを目指している。
データセットとベンチマークコードは、https://github.com/cruiseresearchgroup/Massive-STEPSで公開されている。
関連論文リスト
- POIFormer: A Transformer-Based Framework for Accurate and Scalable Point-of-Interest Attribution [3.729614737011418]
textsfPOIFormerは、正確で効率的なPOI属性のためのトランスフォーマーベースの新しいフレームワークである。
textsfPOIFormerは、大規模でノイズの多いモビリティデータセットにおいて、正確で効率的な属性を可能にする。
論文 参考訳(メタデータ) (2025-07-12T04:37:52Z) - TUM2TWIN: Introducing the Large-Scale Multimodal Urban Digital Twin Benchmark Dataset [90.97440987655084]
都市デジタルツインズ(UDT)は、都市管理と多様なソースからの複雑な異種データの統合に欠かせないものとなっている。
これらの課題に対処するために、最初の総合的マルチモーダルなUrban Digital TwinベンチマークデータセットTUM2TWINを紹介する。
このデータセットには、地理的にセマンティックに整合した3Dモデルとネットワーク、およびさまざまな地球、モバイル、航空、衛星観測結果、約10,000ドル以上のデータサブセット、そして現在767GBのデータが含まれている。
論文 参考訳(メタデータ) (2025-05-12T09:48:32Z) - Location Aware Modular Biencoder for Tourism Question Answering [33.5507972300392]
本稿では,QAタスクを高密度ベクトル探索問題として扱うことを提案する。
質問とPOIを別々にエンコードし、埋め込み空間の類似性を利用して最も関連性の高いPOIを検索する。
実世界の観光QAデータセットの実験は、我々のアプローチが従来の手法よりも効果的で、効率的で、優れたことを実証している。
論文 参考訳(メタデータ) (2024-01-04T10:39:58Z) - trajdata: A Unified Interface to Multiple Human Trajectory Datasets [32.93180256927027]
複数の人的トラジェクトリデータセットに対する統一インターフェースであるtrajdataを提案する。
Trajdataは、トラジェクトリとマップデータのためのシンプルで均一で効率的な表現とAPIを提供する。
論文 参考訳(メタデータ) (2023-07-26T02:45:59Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - Large Scale Real-World Multi-Person Tracking [68.27438015329807]
本稿では,新しい大規模多人数追跡データセットであるtexttPersonPath22を提案する。
MOT17、HiEve、MOT20などの高品質なマルチオブジェクト追跡データセットよりも桁違いに大きい。
論文 参考訳(メタデータ) (2022-11-03T23:03:13Z) - Self-supervised Graph-based Point-of-interest Recommendation [66.58064122520747]
Next Point-of-Interest (POI)レコメンデーションは、ロケーションベースのeコマースにおいて重要なコンポーネントとなっている。
自己教師付きグラフ強化POIレコメンデーション(S2GRec)を次のPOIレコメンデーションのために提案する。
特に,グローバル・トランジション・グラフと局所軌道グラフの両方からの協調的な信号を組み込むために,グラフ強化セルフアテンテート・レイヤを考案した。
論文 参考訳(メタデータ) (2022-10-22T17:29:34Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。