論文の概要: Human Mobility Datasets Enriched With Contextual and Social Dimensions
- arxiv url: http://arxiv.org/abs/2510.02333v1
- Date: Fri, 26 Sep 2025 07:45:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.006283
- Title: Human Mobility Datasets Enriched With Contextual and Social Dimensions
- Title(参考訳): コンテキストと社会的次元で強化されたヒューマンモビリティデータセット
- Authors: Chiara Pugliese, Francesco Lettich, Guido Rocchietti, Chiara Renso, Fabio Pinelli,
- Abstract要約: 意味的に富んだ人間の軌道の2つのデータセットと、それらを構築するためのパイプラインを提示する。
トラジェクトリはOpenStreetMapから取得した公開GPSトレースである。
新しいセマンティックな特徴は、大規模言語モデルによって生成された合成的で現実的なソーシャルメディア投稿を含めることである。
- 参考スコア(独自算出の注目度): 1.0268257686354103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this resource paper, we present two publicly available datasets of semantically enriched human trajectories, together with the pipeline to build them. The trajectories are publicly available GPS traces retrieved from OpenStreetMap. Each dataset includes contextual layers such as stops, moves, points of interest (POIs), inferred transportation modes, and weather data. A novel semantic feature is the inclusion of synthetic, realistic social media posts generated by Large Language Models (LLMs), enabling multimodal and semantic mobility analysis. The datasets are available in both tabular and Resource Description Framework (RDF) formats, supporting semantic reasoning and FAIR data practices. They cover two structurally distinct, large cities: Paris and New York. Our open source reproducible pipeline allows for dataset customization, while the datasets support research tasks such as behavior modeling, mobility prediction, knowledge graph construction, and LLM-based applications. To our knowledge, our resource is the first to combine real-world movement, structured semantic enrichment, LLM-generated text, and semantic web compatibility in a reusable framework.
- Abstract(参考訳): 本資料では,意味的に富んだ人間の軌道の2つの公開データセットと,それらを構築するためのパイプラインについて述べる。
トラジェクトリはOpenStreetMapから取得した公開GPSトレースである。
各データセットには、停止、移動、関心点(POI)、推論された輸送モード、気象データなどのコンテキスト層が含まれている。
新しいセマンティックな特徴は、Large Language Models (LLMs) によって生成された合成的で現実的なソーシャルメディアポストを取り入れ、マルチモーダルおよびセマンティックモビリティー分析を可能にすることである。
データセットは表形式とリソース記述フレームワーク(RDF)形式で利用可能で、セマンティック推論とFAIRデータプラクティスをサポートする。
パリとニューヨークという、構造的に異なる大きな2つの都市をカバーしている。
我々のオープンソースの再現可能なパイプラインはデータセットのカスタマイズを可能にし、データセットは行動モデリング、モビリティ予測、知識グラフ構築、LLMベースのアプリケーションなどの研究タスクをサポートします。
我々の知る限り、我々のリソースは、実世界の動き、構造化セマンティックエンリッチメント、LLM生成テキスト、再利用可能なフレームワークにおけるセマンティックウェブの互換性を組み合わせた最初のものである。
関連論文リスト
- TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs [3.41612427812159]
デジタルコンテンツ作成ツールでは、ユーザは、API呼び出しにマップしなければならない自然言語クエリを通じて、ニーズを表現します。
既存の合成データ生成アプローチでは、実世界のデータ分散を複製することができない。
高品質な合成学習データを生成するルータベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-05-15T16:53:45Z) - MapExplorer: New Content Generation from Low-Dimensional Visualizations [60.02149343347818]
低次元の可視化や「投影マップ」は大規模で複雑なデータセットの解釈に広く用いられている。
これらの視覚化は、既存の知識空間を理解するのに役立つだけでなく、未知の領域への探索を暗黙的にガイドする。
プロジェクションマップ内の座標をコヒーレントでコンテキストに整合したテキストコンテンツに変換する新しい知識発見タスクであるMapExplorerを紹介する。
論文 参考訳(メタデータ) (2024-12-24T20:16:13Z) - Capturing research literature attitude towards Sustainable Development Goals: an LLM-based topic modeling approach [0.7806050661713976]
持続可能な開発目標は2015年に国連によって策定され、2030年までにこれらの世界的な課題に対処した。
自然言語処理技術は、研究文献の中のSDGに関する議論を明らかにするのに役立つ。
我々は,Scopusデータベースからコンテンツを取り出し,SDGの5つのグループ専用のデータセットを作成する,完全に自動化されたパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-05T09:37:23Z) - Deciphering Human Mobility: Inferring Semantics of Trajectories with Large Language Models [10.841035090991651]
本稿では,ユーザの職業カテゴリー,活動,シーケンス,軌道記述の3つの重要な側面を通じて意味推論を定義する。
本稿では,トラジェクトリデータのセマンティック分析を活用するために,大規模言語モデルを用いたトラジェクトリ意味推論(TSI-LLM)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-30T08:55:48Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - Harnessing Explanations: LLM-to-LM Interpreter for Enhanced
Text-Attributed Graph Representation Learning [51.90524745663737]
重要なイノベーションは、機能として説明を使用することで、下流タスクにおけるGNNのパフォーマンス向上に利用できます。
提案手法は、確立されたTAGデータセットの最先端結果を実現する。
本手法はトレーニングを著しく高速化し,ogbn-arxivのベースラインに最も近い2.88倍の改善を実現した。
論文 参考訳(メタデータ) (2023-05-31T03:18:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。