論文の概要: Multimodal Trajectory Representation Learning for Travel Time Estimation
- arxiv url: http://arxiv.org/abs/2510.05840v1
- Date: Tue, 07 Oct 2025 12:04:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.237735
- Title: Multimodal Trajectory Representation Learning for Travel Time Estimation
- Title(参考訳): 旅行時間推定のための多モーダル軌道表現学習
- Authors: Zhi Liu, Xuyuan Hu, Xiao Han, Zhehao Dai, Zhaolin Deng, Guojiang Shen, Xiangjie Kong,
- Abstract要約: 本稿では,Multimodal Dynamic Trajectory Integrationフレームワークを紹介する。
GPSシーケンス、グリッドトラジェクトリ、道路ネットワークの制約を統合して、TTEの精度を向上させる。
3つの実世界のデータセットの実験において、最先端のベースラインを一貫して上回る。
- 参考スコア(独自算出の注目度): 15.25848441558445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate travel time estimation (TTE) plays a crucial role in intelligent transportation systems. However, it remains challenging due to heterogeneous data sources and complex traffic dynamics. Moreover, conventional approaches typically convert trajectories into fixed-length representations, neglecting the inherent variability of real-world trajectories, which often leads to information loss or feature redundancy. To address these challenges, this paper introduces the Multimodal Dynamic Trajectory Integration (MDTI) framework--a novel multimodal trajectory representation learning approach that integrates GPS sequences, grid trajectories, and road network constraints to enhance TTE accuracy. MDTI employs modality-specific encoders and a cross-modal interaction module to capture complementary spatial, temporal, and topological semantics, while a dynamic trajectory modeling mechanism adaptively regulates information density for trajectories of varying lengths. Two self-supervised pretraining objectives, named contrastive alignment and masked language modeling, further strengthen multimodal consistency and contextual understanding. Extensive experiments on three real-world datasets demonstrate that MDTI consistently outperforms state-of-the-art baselines, confirming its robustness and strong generalization abilities. The code is publicly available at: https://github.com/freshhxy/MDTI/
- Abstract(参考訳): 正確な旅行時間推定(TTE)は、インテリジェント交通システムにおいて重要な役割を担っている。
しかし、ヘテロジニアスなデータソースと複雑なトラフィックダイナミクスのため、これは依然として困難である。
さらに、従来の手法では、トラジェクトリを固定長の表現に変換し、現実のトラジェクトリの本質的な変動を無視し、しばしば情報損失や特徴の冗長性をもたらす。
これらの課題に対処するため,本稿では,TTEの精度を高めるために,GPSシーケンス,グリッドトラジェクトリ,ロードネットワーク制約を統合した新しいマルチモーダルトラジェクトリ表現学習手法であるMDTI(Multimodal Dynamic Trajectory Integration)フレームワークを提案する。
MDTIは相補的空間的・時間的・トポロジ的意味論を捉え、動的軌跡モデリング機構は様々な長さの軌跡に対する情報密度を適応的に制御する。
コントラッシブアライメントとマスキング言語モデリングという2つの自己監督型事前学習目標により、マルチモーダル一貫性と文脈理解がさらに強化される。
3つの実世界のデータセットに対する大規模な実験により、MDTIは一貫して最先端のベースラインを上回り、その堅牢性と強力な一般化能力を確認している。
コードは、https://github.com/freshhxy/MDTI/で公開されている。
関連論文リスト
- Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - DG-STMTL: A Novel Graph Convolutional Network for Multi-Task Spatio-Temporal Traffic Forecasting [0.0]
正確な予測の鍵となる課題は、複雑な時間的依存関係をモデル化し、データ固有のダイナミクスに適応する方法である。
従来のグラフコンテンポラルネットワーク(GCN)は、バイアスや学習可能なパターンを導入する静的な隣接行列に悩まされることが多い。
本研究では,新しいMTLフレームワークDGS-TLTM(Dynamic Group-wise S-temporal Multi-Temporal Learning)を提案する。
論文 参考訳(メタデータ) (2025-04-10T15:00:20Z) - Resource-Efficient Beam Prediction in mmWave Communications with Multimodal Realistic Simulation Framework [57.994965436344195]
ビームフォーミングは、方向と強度を最適化して信号伝送を改善するミリ波通信において重要な技術である。
マルチモーダルセンシング支援ビーム予測は,ユーザ位置やネットワーク条件を予測するために,さまざまなセンサデータを使用して注目されている。
その有望な可能性にもかかわらず、マルチモーダルセンシング支援ビーム予測の採用は、高い計算複雑性、高いコスト、限られたデータセットによって妨げられている。
論文 参考訳(メタデータ) (2025-04-07T15:38:25Z) - Exploiting Multimodal Spatial-temporal Patterns for Video Object Tracking [53.33637391723555]
本研究では,STTrack というマルチモーダル空間時間追跡手法を提案する。
従来のパラダイムとは対照的に,マルチモーダル時間情報を含むトークン列を連続的に生成する時間状態生成器(TSG)を導入している。
これらの時間情報トークンは、次の時刻におけるターゲットの局所化を誘導し、ビデオフレーム間の長距離コンテキスト関係を確立し、ターゲットの時間軌道を捕捉するために使用される。
論文 参考訳(メタデータ) (2024-12-20T09:10:17Z) - Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-17T03:56:12Z) - Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner [46.866240648471894]
時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文 参考訳(メタデータ) (2024-05-06T06:23:06Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。