論文の概要: Training Machine Learning Models on Human Spatio-temporal Mobility Data: An Experimental Study [Experiment Paper]
- arxiv url: http://arxiv.org/abs/2508.13135v2
- Date: Tue, 19 Aug 2025 01:52:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 13:30:22.903733
- Title: Training Machine Learning Models on Human Spatio-temporal Mobility Data: An Experimental Study [Experiment Paper]
- Title(参考訳): 時空間移動データに基づく機械学習モデルの学習:実験的検討 [実験論文]
- Authors: Yueyang Liu, Lance Kennedy, Ruochen Kong, Joon-Seok Kim, Andreas Züfle,
- Abstract要約: 個人レベルの人体移動予測は、感染症のモニタリング、子供、高齢者のケアへの応用に関する重要な研究のトピックとして浮上している。
機械学習モデルをトレーニングするためのベストプラクティスを決定すること。
意味情報を明示的に含めることで、モデルが生活の個々のパターンをよりよく理解し、予測を改善することができることを示す。
- 参考スコア(独自算出の注目度): 0.5382679710017696
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Individual-level human mobility prediction has emerged as a significant topic of research with applications in infectious disease monitoring, child, and elderly care. Existing studies predominantly focus on the microscopic aspects of human trajectories: such as predicting short-term trajectories or the next location visited, while offering limited attention to macro-level mobility patterns and the corresponding life routines. In this paper, we focus on an underexplored problem in human mobility prediction: determining the best practices to train a machine learning model using historical data to forecast an individuals complete trajectory over the next days and weeks. In this experiment paper, we undertake a comprehensive experimental analysis of diverse models, parameter configurations, and training strategies, accompanied by an in-depth examination of the statistical distribution inherent in human mobility patterns. Our empirical evaluations encompass both Long Short-Term Memory and Transformer-based architectures, and further investigate how incorporating individual life patterns can enhance the effectiveness of the prediction. We show that explicitly including semantic information such as day-of-the-week and user-specific historical information can help the model better understand individual patterns of life and improve predictions. Moreover, since the absence of explicit user information is often missing due to user privacy, we show that the sampling of users may exacerbate data skewness and result in a substantial loss in predictive accuracy. To mitigate data imbalance and preserve diversity, we apply user semantic clustering with stratified sampling to ensure that the sampled dataset remains representative. Our results further show that small-batch stochastic gradient optimization improves model performance, especially when human mobility training data is limited.
- Abstract(参考訳): 個人レベルの人体移動予測は、感染症のモニタリング、子供、高齢者のケアへの応用に関する重要な研究のトピックとして浮上している。
既存の研究は主に人間の軌道の微視的な側面に焦点を当てており、例えば短期的な軌跡の予測や、来訪した場所の予測などであり、マクロレベルの移動パターンやそれに対応する生活習慣に限定的な注意を払っている。
本稿では、過去のデータを用いて機械学習モデルを訓練し、次の日と数週間にわたって個人が完全な軌道を予測するためのベストプラクティスを決定するという、人間の移動予測における未探索の問題に焦点を当てる。
本研究では, 多様なモデル, パラメータ構成, トレーニング戦略の総合的な実験分析を行い, 人間の移動パターンに固有の統計分布の詳細な検討を行った。
我々の経験的評価は、長期記憶とトランスフォーマーに基づくアーキテクチャの両方を包含し、個別の生活パターンを取り入れることで、予測の有効性を高めることができる。
日報やユーザ固有の歴史的情報などの意味情報を明示的に含めることで、モデルが生活の個々のパターンをよりよく理解し、予測を改善することができることを示す。
さらに、ユーザのプライバシーが原因で明示的なユーザ情報が欠落することがしばしばあることから、ユーザのサンプリングによってデータの歪が悪化し、予測精度が著しく低下する可能性があることを示す。
データの不均衡を緩和し,多様性を保ちつつ,ユーザセマンティッククラスタリングと階層化サンプリングを適用し,サンプルデータセットが代表的であることを保証する。
以上の結果から,小型確率勾配最適化は,特に人体移動訓練データに制限がある場合,モデル性能を向上させることが示唆された。
関連論文リスト
- Leveraging Language Models for Analyzing Longitudinal Experiential Data in Education [0.8026406775824594]
本研究では,STEM学生の学術的軌跡の早期予測に事前学習言語モデル(LM)を活用する新しい手法を提案する。
このようなデータを扱う上で重要な課題は、欠落した値の高頻度、コストのかかるデータ収集によるデータセットサイズ制限、モダリティ間の複雑な時間的変動である。
論文 参考訳(メタデータ) (2025-03-27T15:37:23Z) - Uncertainty-aware Human Mobility Modeling and Anomaly Detection [24.22648449430148]
生のGPSデータを連続的静止点イベントとしてモデル化した人間の行動における異常検出を定式化する。
提案したモデルUSTADとアレータティック不確実性推定を併用する。
実験の結果,USTADは産業規模データのベースライン以上でAUCROCの異常検出を3%-15%改善することがわかった。
論文 参考訳(メタデータ) (2024-10-02T06:57:08Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Data Attribution for Diffusion Models: Timestep-induced Bias in Influence Estimation [53.27596811146316]
拡散モデルは、以前の文脈における瞬間的な入出力関係ではなく、一連のタイムステップで操作する。
本稿では、この時間的ダイナミクスを取り入れた拡散トラクInについて、サンプルの損失勾配ノルムが時間ステップに大きく依存していることを確認する。
そこで我々はDiffusion-ReTracを再正規化適応として導入し、興味のあるサンプルを対象にしたトレーニングサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2024-01-17T07:58:18Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Zero-shot meta-learning for small-scale data from human subjects [10.320654885121346]
我々は,サンプル外テストデータに対する限られたトレーニングデータを用いて,新しい予測タスクに迅速に適応するフレームワークを開発した。
本モデルでは, 介入による遅延処理効果を学習し, 設計上はマルチタスク予測を自然に処理できる。
我々のモデルは、より広い人口への小型人間研究の一般化を向上するために重要である。
論文 参考訳(メタデータ) (2022-03-29T17:42:04Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Combining Graph Neural Networks and Spatio-temporal Disease Models to
Predict COVID-19 Cases in Germany [0.0]
いくつかの専門家は、新型コロナウイルスの拡散を説明するために人間の移動性を考慮する必要性を求めた。
ほとんどの統計モデルや疫学モデルでは、人間の移動性を符号化するデータを含む非構造化データソースを直接組み込むことはできない。
本稿では,両研究方向のトレードオフを提案し,統計回帰モデルと機械学習モデルの利点を組み合わせた新しい学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-03T16:39:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。