論文の概要: PatchTraj: Unified Time-Frequency Representation Learning via Dynamic Patches for Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2507.19119v3
- Date: Thu, 31 Jul 2025 15:04:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 13:02:07.676049
- Title: PatchTraj: Unified Time-Frequency Representation Learning via Dynamic Patches for Trajectory Prediction
- Title(参考訳): PatchTraj: 軌道予測のための動的パッチによる統合時間周波数表現学習
- Authors: Yanghong Liu, Xingping Dong, Ming Li, Weixing Zhang, Yidong Lou,
- Abstract要約: 軌道予測のための時間周波数ジョイントモデリングを統合した動的パッチベースのフレームワークを提案する。
具体的には、軌道を生の時間列と周波数成分に分解し、動的パッチ分割を用いてマルチスケールセグメンテーションを行う。
その結果、拡張された埋め込みは強力な表現力を示し、バニラアーキテクチャを使用した場合でも正確な予測を可能にする。
- 参考スコア(独自算出の注目度): 14.48846131633279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pedestrian trajectory prediction is crucial for autonomous driving and robotics. While existing point-based and grid-based methods expose two main limitations: insufficiently modeling human motion dynamics, as they fail to balance local motion details with long-range spatiotemporal dependencies, and the time representations lack interaction with their frequency components in jointly modeling trajectory sequences. To address these challenges, we propose PatchTraj, a dynamic patch-based framework that integrates time-frequency joint modeling for trajectory prediction. Specifically, we decompose the trajectory into raw time sequences and frequency components, and employ dynamic patch partitioning to perform multi-scale segmentation, capturing hierarchical motion patterns. Each patch undergoes adaptive embedding with scale-aware feature extraction, followed by hierarchical feature aggregation to model both fine-grained and long-range dependencies. The outputs of the two branches are further enhanced via cross-modal attention, facilitating complementary fusion of temporal and spectral cues. The resulting enhanced embeddings exhibit strong expressive power, enabling accurate predictions even when using a vanilla Transformer architecture. Extensive experiments on ETH-UCY, SDD, NBA, and JRDB datasets demonstrate that our method achieves state-of-the-art performance. Notably, on the egocentric JRDB dataset, PatchTraj attains significant relative improvements of 26.7% in ADE and 17.4% in FDE, underscoring its substantial potential in embodied intelligence.
- Abstract(参考訳): 歩行者の軌道予測は自動運転とロボット工学にとって不可欠である。
既存のポイントベース法とグリッドベース法は、人間の運動力学を不十分にモデル化するが、局所運動の詳細と長距離時空間依存性のバランスが取れず、時間表現は、軌道列を共同でモデル化する際の周波数成分との相互作用を欠いている。
これらの課題に対処するために、軌道予測のための時間周波数関節モデリングを統合する動的パッチベースのフレームワークであるPatchTrajを提案する。
具体的には、軌道を生の時間列と周波数成分に分解し、動的パッチ分割を用いてマルチスケールセグメンテーションを行い、階層的な動きパターンを捉える。
各パッチは、スケールアウェアな特徴抽出による適応的な埋め込みを実行し、続いて階層的な特徴集約によって、きめ細かい依存性と長距離依存関係の両方をモデル化する。
2つの枝の出力は、時間的およびスペクトル的なキューの相補的な融合を促進するために、クロスモーダルな注意によってさらに増強される。
その結果、拡張された埋め込みは強力な表現力を示し、バニラトランスフォーマーアーキテクチャを使用しても正確な予測を可能にする。
ETH-UCY, SDD, NBA, JRDBデータセットの大規模実験により, 本手法が最先端の性能を実現することを示す。
特に、エゴセントリックなJRDBデータセットにおいて、PatchTrajはADEで26.7%、FDEで17.4%の大幅な相対的な改善を達成し、インテリジェンスを具現化する可能性を示している。
関連論文リスト
- Learning Spatio-Temporal Dynamics for Trajectory Recovery via Time-Aware Transformer [9.812530969395906]
現実世界の応用では、GPSトラジェクトリはサンプリングレートが低く、連続する点の間に大きく不規則な間隔があることが多い。
本稿では,軌道サンプリング率の向上をめざして,地図制約のトラジェクトリリカバリの課題に対処する。
論文 参考訳(メタデータ) (2025-05-20T03:09:17Z) - Real-Time Moving Flock Detection in Pedestrian Trajectories Using Sequential Deep Learning Models [1.2289361708127877]
本稿では,マルチペデストリアントラジェクトリにおけるリアルタイムフロック検出に,リカレントニューラルネットワーク(RNN)を含む逐次的深層学習モデルを用いることを検討した。
本手法は実世界のグループ移動データセットを用いて検証し、その頑健さを様々なシーケンスの長さと多様な動きパターンで実証する。
我々は,護送船団や群れなどの集団行動の他の形態を特定するためのアプローチを拡張し,より包括的なマルチエージェント行動分析の道を開く。
論文 参考訳(メタデータ) (2025-02-21T07:04:34Z) - Multi-step Temporal Modeling for UAV Tracking [14.687636301587045]
MT-Track(MT-Track)は,UAV追跡の効率化を目的とした,効率的な多段階時間モデリングフレームワークである。
我々はテンプレートと検索領域の特徴間の相互作用を動的に評価するユニークな時間相関モジュールを公表する。
トラッキングシーケンスにおける時間的知識をモデル化することにより,過去のフレームと現在のフレームの相関マップを洗練するための相互変換モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-07T09:48:13Z) - Triplet Attention Transformer for Spatiotemporal Predictive Learning [9.059462850026216]
本稿では,フレーム間動的特徴とフレーム内静的特徴の両方を捉えるために,革新的な三重項注意変換器を提案する。
このモデルはトリプレット・アテンション・モジュール(TAM)を組み込んだもので、時間、空間、チャネル次元における自己アテンションのメカニズムを探求することで、従来のリカレント・ユニットを置き換える。
論文 参考訳(メタデータ) (2023-10-28T12:49:33Z) - Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.48716096286417]
本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。
各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。
頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-14T02:58:27Z) - PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for
Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。
本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。
提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文 参考訳(メタデータ) (2023-01-19T08:42:40Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - D2-TPred: Discontinuous Dependency for Trajectory Prediction under
Traffic Lights [68.76631399516823]
本稿では,空間的動的相互作用グラフ(SDG)と行動依存グラフ(BDG)を用いて,交通信号に対する軌道予測手法D2-TPredを提案する。
実験の結果,VTP-TLではADEとFDEでそれぞれ20.45%,20.78%以上を達成できた。
論文 参考訳(メタデータ) (2022-07-21T10:19:07Z) - Forecast Network-Wide Traffic States for Multiple Steps Ahead: A Deep
Learning Approach Considering Dynamic Non-Local Spatial Correlation and
Non-Stationary Temporal Dependency [6.019104024723682]
本研究では,交通予測における2つの問題について検討する。(1)交通リンク間の動的・非局所的な空間的相関を捉え,(2)正確な複数ステップの予測を行うための時間依存性のダイナミクスをモデル化する。
本稿では,これらの問題に対処するため,時空間列列モデル(STSeq2Seq)というディープラーニングフレームワークを提案する。
このモデルは、時間的特徴を捉えるためにシーケンスからシーケンス(seq2seq)アーキテクチャに基づいて構築され、空間情報を集約するためのグラフ畳み込みに依存している。
論文 参考訳(メタデータ) (2020-04-06T03:40:56Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z) - Spatial-Temporal Transformer Networks for Traffic Flow Forecasting [74.76852538940746]
本稿では,長期交通予測の精度を向上させるため,時空間変圧器ネットワーク(STTN)の新たなパラダイムを提案する。
具体的には、有向空間依存を動的にモデル化することにより、空間変換器と呼ばれる新しいグラフニューラルネットワークを提案する。
提案モデルにより,長期間にわたる空間的依存関係に対する高速かつスケーラブルなトレーニングが可能になる。
論文 参考訳(メタデータ) (2020-01-09T10:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。