論文の概要: Blurred Encoding for Trajectory Representation Learning
- arxiv url: http://arxiv.org/abs/2511.13741v1
- Date: Wed, 12 Nov 2025 03:51:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.66467
- Title: Blurred Encoding for Trajectory Representation Learning
- Title(参考訳): 軌道表現学習のためのブラインド符号化
- Authors: Silin Zhou, Yao Chen, Shuo Shang, Lisi Chen, Bingsheng He, Ryosuke Shibasaki,
- Abstract要約: トレイ表現学習(TRL)は、軌跡をベクトル埋め込みにマッピングし、軌跡分類や類似性探索などの作業を容易にする。
State-of-the-art (SOTA) TRL法は、生のGPSトラジェクトリをグリッドや道路トラジェクトリに変換し、ハイレベルな旅行セマンティクスをキャプチャする。
しかし、複数のGPSポイントが単一のグリッドセルまたは道路セグメントにグループ化されるため、細かな空間時間的詳細は失われます。
我々は,階層的パッチを作成するためにGPS座標の精度を徐々に低下させるBLUEと呼ばれるBLUrred jector法を提案する。
- 参考スコア(独自算出の注目度): 56.642548506419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory representation learning (TRL) maps trajectories to vector embeddings and facilitates tasks such as trajectory classification and similarity search. State-of-the-art (SOTA) TRL methods transform raw GPS trajectories to grid or road trajectories to capture high-level travel semantics, i.e., regions and roads. However, they lose fine-grained spatial-temporal details as multiple GPS points are grouped into a single grid cell or road segment. To tackle this problem, we propose the BLUrred Encoding method, dubbed BLUE, which gradually reduces the precision of GPS coordinates to create hierarchical patches with multiple levels. The low-level patches are small and preserve fine-grained spatial-temporal details, while the high-level patches are large and capture overall travel patterns. To complement different patch levels with each other, our BLUE is an encoder-decoder model with a pyramid structure. At each patch level, a Transformer is used to learn the trajectory embedding at the current level, while pooling prepares inputs for the higher level in the encoder, and up-resolution provides guidance for the lower level in the decoder. BLUE is trained using the trajectory reconstruction task with the MSE loss. We compare BLUE with 8 SOTA TRL methods for 3 downstream tasks, the results show that BLUE consistently achieves higher accuracy than all baselines, outperforming the best-performing baselines by an average of 30.90%. Our code is available at https://github.com/slzhou-xy/BLUE.
- Abstract(参考訳): トラジェクティブ表現学習(TRL)は、トラジェクトリをベクトル埋め込みにマッピングし、トラジェクトリ分類や類似性探索などのタスクを促進する。
State-of-the-art (SOTA) TRL法は、GPSの生の軌跡をグリッドや道路の軌跡に変換し、高度旅行の意味、すなわち地域や道路を捉える。
しかし、複数のGPSポイントが単一グリッドセルまたは道路セグメントにグループ化されるため、細粒度の空間時間的詳細は失われる。
この問題に対処するため, BLUEと呼ばれるBLUrred Encoding法を提案する。
低レベルのパッチは小さく、きめ細かい時空間の詳細を保存し、高レベルのパッチは大きいので、全体の旅行パターンをキャプチャする。
異なるパッチレベルを補完するために,私たちのBLUEは,ピラミッド構造を持つエンコーダデコーダモデルである。
各パッチレベルでは、トランスフォーマーを使用して現在のレベルでの軌道埋め込みを学習し、プールはエンコーダの上位レベルへの入力を準備し、高解像度はデコーダの下位レベルへのガイダンスを提供する。
BLUEはMSE損失を伴う軌道再構成タスクを用いて訓練される。
BLUEを3つのダウンストリームタスクに対して8つのSOTA TRL法と比較したところ、BLUEは全てのベースラインよりも常に高い精度を達成し、平均30.90%の性能のベースラインよりも優れていた。
私たちのコードはhttps://github.com/slzhou-xy/BLUE.comで公開されています。
関連論文リスト
- R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual Localization [66.87005863868181]
可視性グラフに基づくグローバルエンコーディング学習とデータ拡張戦略を導入する。
ネットワークアーキテクチャとローカル特徴抽出モジュールを再考する。
本手法は,ネットワークアンサンブルや3D監視に頼ることなく,大規模データセットに挑戦する最先端の手法を実現する。
論文 参考訳(メタデータ) (2025-01-02T18:59:08Z) - RED: Effective Trajectory Representation Learning with Comprehensive Information [41.58502888707689]
トラジェクティブ表現学習(TRL)は、様々な下流タスクに使用できるベクトルにトラジェクトリをマッピングする。
本稿では,複数のトラジェクトリ情報を効果的に活用する自己教師型TRLフレームワークREDを提案する。
論文 参考訳(メタデータ) (2024-11-22T17:51:21Z) - NLP-enabled Trajectory Map-matching in Urban Road Networks using a Transformer-based Encoder-decoder [1.3812010983144802]
本研究では,NLPにインスパイアされた機械翻訳としてタスクを定式化する,データ駆動型深層学習型マップマッチングフレームワークを提案する。
変圧器を用いたエンコーダ・デコーダモデルでは,ノイズの多いGPS点の文脈表現を学習し,軌道の挙動や道路構造をエンドツーエンドに推定する。
合成軌道実験により、この手法は文脈認識を統合することによって従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-04-18T18:39:23Z) - SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation [91.91385816767057]
オープンボキャブラリセマンティックセグメンテーションは、ピクセルをオープンなカテゴリの集合から異なるセマンティックグループに区別する試みである。
オープン語彙セマンティックセグメンテーションのための単純なエンコーダデコーダSEDを提案する。
SED法では、ADE20KではmIoUスコアが31.6%、A6000では画像あたり82ミリ秒(ms$)のカテゴリが150である。
論文 参考訳(メタデータ) (2023-11-27T05:00:38Z) - RNTrajRec: Road Network Enhanced Trajectory Recovery with
Spatial-Temporal Transformer [15.350300338463969]
本稿では,道路網を改良したトランスフォーマーベースフレームワーク RNTrajRec を提案する。
RNTrajRecはまずグラフモデル、すなわちGridGNNを使用して、各道路セグメントの埋め込み機能を学ぶ。
次にサブグラフ生成モジュールを導入し、各GPSポイントをGPSポイント周辺の道路ネットワークのサブグラフ構造として表現する。
論文 参考訳(メタデータ) (2022-11-23T11:28:32Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。