論文の概要: TrajDiff: Diffusion Bridge Network with Semantic Alignment for Trajectory Similarity Computation
- arxiv url: http://arxiv.org/abs/2506.15898v1
- Date: Wed, 18 Jun 2025 21:52:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.870403
- Title: TrajDiff: Diffusion Bridge Network with Semantic Alignment for Trajectory Similarity Computation
- Title(参考訳): TrajDiff: 軌道類似性計算のためのセマンティックアライメント付き拡散ブリッジネットワーク
- Authors: Xiao Zhang, Xingyu Zhao, Hong Xia, Yuan Cao, Guiyuan Jiang, Junyu Dong, Yanwei Yu,
- Abstract要約: そこで我々はTrajDiffという新しい軌道類似性計算フレームワークを提案する。
具体的には、TrajDiffは、アダプティブフュージョンを備えたクロスアテンションとアテンションスコアマスク機構に依存している。
3つの公開データセットに対する大規模な実験は、TrajDiffが一貫して最先端のベースラインを上回っていることを示している。
- 参考スコア(独自算出の注目度): 39.42796455901991
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the proliferation of location-tracking technologies, massive volumes of trajectory data are continuously being collected. As a fundamental task in trajectory data mining, trajectory similarity computation plays a critical role in a wide range of real-world applications. However, existing learning-based methods face three challenges: First, they ignore the semantic gap between GPS and grid features in trajectories, making it difficult to obtain meaningful trajectory embeddings. Second, the noise inherent in the trajectories, as well as the noise introduced during grid discretization, obscures the true motion patterns of the trajectories. Third, existing methods focus solely on point-wise and pair-wise losses, without utilizing the global ranking information obtained by sorting all trajectories according to their similarity to a given trajectory. To address the aforementioned challenges, we propose a novel trajectory similarity computation framework, named TrajDiff. Specifically, the semantic alignment module relies on cross-attention and an attention score mask mechanism with adaptive fusion, effectively eliminating semantic discrepancies between data at two scales and generating a unified representation. Additionally, the DDBM-based Noise-robust Pre-Training introduces the transfer patterns between any two trajectories into the model training process, enhancing the model's noise robustness. Finally, the overall ranking-aware regularization shifts the model's focus from a local to a global perspective, enabling it to capture the holistic ordering information among trajectories. Extensive experiments on three publicly available datasets show that TrajDiff consistently outperforms state-of-the-art baselines. In particular, it achieves an average HR@1 gain of 33.38% across all three evaluation metrics and datasets.
- Abstract(参考訳): 位置追跡技術の普及に伴い、大量の軌跡データが継続的に収集されている。
軌道データマイニングの基本的な課題として、軌道類似性計算は、幅広い現実世界のアプリケーションにおいて重要な役割を果たす。
しかし、既存の学習ベースの手法は3つの課題に直面している: まず、軌跡におけるGPSとグリッドの特徴のセマンティックなギャップを無視し、意味のある軌跡の埋め込みを得ることが困難になる。
第二に、軌跡に固有のノイズとグリッドの離散化時に発生するノイズは、軌跡の真の運動パターンを曖昧にする。
第3に、既存の手法は、与えられた軌跡との類似性に応じて全ての軌跡をソートして得られるグローバルなランキング情報を活用することなく、ポイントワイドとペアワイドの損失にのみ焦点をあてる。
上記の課題に対処するため,TrajDiff という新しい軌道類似性計算フレームワークを提案する。
具体的には、セマンティックアライメントモジュールは、アダプティブ融合を伴うクロスアテンションとアテンションスコアマスク機構に依存し、2スケールのデータ間のセマンティック不一致を効果的に排除し、統一表現を生成する。
さらに、DDBMベースのノイズロバスト・プレトレーニングでは、2つの軌道間の伝達パターンをモデルトレーニングプロセスに導入し、モデルのノイズロバスト性を高める。
最後に、ランキングアウェアの全体正規化は、モデルの焦点を局所的な視点からグローバルな視点にシフトさせ、トラジェクトリ間の全体的順序付け情報をキャプチャすることを可能にする。
3つの公開データセットに対する大規模な実験は、TrajDiffが一貫して最先端のベースラインを上回っていることを示している。
特に、3つの評価指標とデータセットで平均的なHR@1ゲイン(33.38%)を達成した。
関連論文リスト
- A Data-Centric Approach to 3D Semantic Segmentation of Railway Scenes [0.0]
本稿では,鉄道固有のOSDaR23データセットのセグメンテーション性能を改善するために,2つのターゲットデータ拡張手法を提案する。
パーソン・インスタンス・ペースト法は、データセットに現実的なバリエーションを注入することにより、遠距離の歩行者のセグメンテーションを強化する。
トラックスペーシフィケーション法は、LiDARスキャンの点密度を再分配し、距離の近距離精度に最小限の影響を与えることなく、遠距離でのトラックセグメンテーションを改善する。
論文 参考訳(メタデータ) (2025-04-25T09:46:31Z) - Towards Stable and Storage-efficient Dataset Distillation: Matching Convexified Trajectory [53.37473225728298]
ディープラーニングと大規模言語モデルの急速な進化により、トレーニングデータの需要が指数関数的に増加した。
MTT(Matching Training Trajectories)は、専門家ネットワークのトレーニングトラジェクトリを、合成データセットで実データ上に複製する、顕著なアプローチである。
そこで本研究では,学生の軌道に対するより良いガイダンスを提供することを目的として,MCT (Matching Convexified Trajectory) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-28T11:06:46Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - DiffTraj: Generating GPS Trajectory with Diffusion Probabilistic Model [44.490978394267195]
軌道生成のための時空間確率モデル(DiffTraj)を提案する。
中心となる考え方は、逆軌道分解過程を通じて白いノイズから地理的軌跡を再構成し、合成することである。
2つの実世界のデータセットの実験により、DiffTrajは直感的に高忠実な軌道を生成することができることが示された。
論文 参考訳(メタデータ) (2023-04-23T08:42:45Z) - Self-supervised Trajectory Representation Learning with Temporal
Regularities and Travel Semantics [30.9735101687326]
Trajectory Representation Learning (TRL) は空間時間データ分析と管理のための強力なツールである。
既存のTRLの作業は通常、トラジェクトリを通常のシーケンスデータとして扱うが、時間的規則性や旅行意味論といった重要な時空間特性は、完全には利用されない。
本稿では,TemporAl規則と旅行意味論,すなわちSTARTを用いた自己教師付き軌道表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-17T13:14:47Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - DouFu: A Double Fusion Joint Learning Method For Driving Trajectory
Representation [13.321587117066166]
軌道表現型共同学習のための新しい多モード融合モデルDouFuを提案する。
まず、軌道データと都市機能ゾーンから生成された動き、経路、グローバルな特徴を設計する。
グローバルなセマンティック機能により、DouFuは各行に対して包括的な埋め込みを生成する。
論文 参考訳(メタデータ) (2022-05-05T07:43:35Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。