論文の概要: GPS-MTM: Capturing Pattern of Normalcy in GPS-Trajectories with self-supervised learning
- arxiv url: http://arxiv.org/abs/2509.24031v1
- Date: Sun, 28 Sep 2025 19:00:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.600057
- Title: GPS-MTM: Capturing Pattern of Normalcy in GPS-Trajectories with self-supervised learning
- Title(参考訳): GPS-MTM:自己教師型学習によるGPSトラジェクトリの正常化パターンの把握
- Authors: Umang Garg, Bowen Zhang, Anantanjit Subrahmanya, Chandrakanth Gudavalli, BS Manjunath,
- Abstract要約: 大規模モビリティデータの基礎モデルであるGPSMasked Trajectory Transformer(GPS-MTM)を紹介する。
GPS-MTMはモビリティを2つの相補的なモードに分解する:状態(興味のあるカテゴリー)と行動(エージェント遷移)
- 参考スコア(独自算出の注目度): 7.240185261197756
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Foundation models have driven remarkable progress in text, vision, and video understanding, and are now poised to unlock similar breakthroughs in trajectory modeling. We introduce the GPSMasked Trajectory Transformer (GPS-MTM), a foundation model for large-scale mobility data that captures patterns of normalcy in human movement. Unlike prior approaches that flatten trajectories into coordinate streams, GPS-MTM decomposes mobility into two complementary modalities: states (point-of-interest categories) and actions (agent transitions). Leveraging a bi-directional Transformer with a self-supervised masked modeling objective, the model reconstructs missing segments across modalities, enabling it to learn rich semantic correlations without manual labels. Across benchmark datasets, including Numosim-LA, Urban Anomalies, and Geolife, GPS-MTM consistently outperforms on downstream tasks such as trajectory infilling and next-stop prediction. Its advantages are most pronounced in dynamic tasks (inverse and forward dynamics), where contextual reasoning is critical. These results establish GPS-MTM as a robust foundation model for trajectory analytics, positioning mobility data as a first-class modality for large-scale representation learning. Code is released for further reference.
- Abstract(参考訳): ファウンデーションモデルは、テキスト、ビジョン、ビデオ理解において顕著な進歩をもたらし、軌道モデリングにおける同様のブレークスルーを解き放ちつつある。
我々は,GPSMasked Trajectory Transformer (GPS-MTM)を紹介した。
軌道を座標ストリームに平らにする従来のアプローチとは異なり、GPS-MTMはモビリティを2つの相補的なモードに分解する:状態 (point-of-interest category) と行動 (agent transitions) である。
自己教師付きマスク付きモデリング目的の双方向トランスフォーマーを利用することで、モデルはモダリティ間で欠落したセグメントを再構築し、手動ラベルなしでリッチなセマンティックな相関関係を学習することができる。
Numosim-LA、Urban Anomalies、Geolifeなど、ベンチマークデータセット全体では、GPS-MTMは、トラジェクトリのインフィルや次のストップ予測といった下流タスクで一貫してパフォーマンスが向上している。
その利点は、文脈推論が不可欠である動的タスク(逆および前方のダイナミクス)において最も顕著である。
これらの結果は、GPS-MTMを軌道解析の堅牢な基盤モデルとして確立し、大規模な表現学習のための第一級のモビリティとしてモビリティデータを位置づけた。
コードはさらなる参照のためにリリースされている。
関連論文リスト
- TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - Learning Spatio-Temporal Dynamics for Trajectory Recovery via Time-Aware Transformer [9.812530969395906]
現実世界の応用では、GPSトラジェクトリはサンプリングレートが低く、連続する点の間に大きく不規則な間隔があることが多い。
本稿では,軌道サンプリング率の向上をめざして,地図制約のトラジェクトリリカバリの課題に対処する。
論文 参考訳(メタデータ) (2025-05-20T03:09:17Z) - Dynamic Intent Queries for Motion Transformer-based Trajectory Prediction [36.287188668060075]
自動運転では、他の交通参加者の動きを正確に予測することが重要である。
本研究は,MTRモデルにシーン特異的な動的意図点を統合することで,この制限に対処する。
本研究は,動的意図点の導入が軌道精度に有意な影響を与えることを示した。
論文 参考訳(メタデータ) (2025-04-22T10:20:35Z) - Unified Human Localization and Trajectory Prediction with Monocular Vision [64.19384064365431]
MonoTransmotionはトランスフォーマーベースのフレームワークで、モノクロカメラのみを使用して、ローカライゼーションと予測タスクを共同で解決する。
両タスクを統合フレームワークで共同でトレーニングすることにより,ノイズの多い入力による実環境シナリオにおいて,我々の手法がより堅牢であることを示す。
論文 参考訳(メタデータ) (2025-03-05T14:18:39Z) - More Than Routing: Joint GPS and Route Modeling for Refine Trajectory
Representation Learning [26.630640299709114]
本稿では,JGRMという自己監督技術に基づく共同GPSとルートモデリングを提案する。
我々は2つのエンコーダを開発し、それぞれルートとGPSの軌跡を表現できるように調整した。
2つのモードからの表現は、モーダル間情報相互作用のための共有変換器に入力される。
論文 参考訳(メタデータ) (2024-02-25T18:27:25Z) - MobilityGPT: Enhanced Human Mobility Modeling with a GPT model [12.01839817432357]
我々はこれらの問題に対処するために、自己回帰生成タスクとして、人間のモビリティモデリングを再構築する。
本稿では,ジオスパティカル・アウェア・ジェネレーティブ・モデルであるモビリティGPTを提案する。
実世界のデータセットの実験では、モビリティGPTは最先端の手法よりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:22:21Z) - MotionTrack: Learning Motion Predictor for Multiple Object Tracking [68.68339102749358]
本研究では,学習可能なモーション予測器を中心に,新しいモーショントラッカーであるMotionTrackを紹介する。
実験結果から、MotionTrackはDancetrackやSportsMOTといったデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-06-05T04:24:11Z) - Motion Transformer with Global Intention Localization and Local Movement
Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。
MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-09-27T16:23:14Z) - Transforming Model Prediction for Tracking [109.08417327309937]
トランスフォーマーは、誘導バイアスの少ないグローバルな関係を捉え、より強力なターゲットモデルの予測を学ぶことができる。
提案したトラッカーをエンドツーエンドにトレーニングし、複数のトラッカーデータセットに関する総合的な実験を行うことで、その性能を検証する。
我々のトラッカーは3つのベンチマークで新しい技術状態を設定し、挑戦的なLaSOTデータセットで68.5%のAUCを達成した。
論文 参考訳(メタデータ) (2022-03-21T17:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。