論文の概要: Progressive Pretext Task Learning for Human Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2407.11588v1
- Date: Tue, 16 Jul 2024 10:48:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 15:32:51.981414
- Title: Progressive Pretext Task Learning for Human Trajectory Prediction
- Title(参考訳): 人間軌道予測のためのプログレッシブ・プレテキスト・タスク・ラーニング
- Authors: Xiaotong Lin, Tianming Liang, Jianhuang Lai, Jian-Fang Hu,
- Abstract要約: 本稿では,PPT(Progressive Pretext Task Learning)フレームワークについて紹介する。
トランスフォーマーを用いたトラジェクトリ予測器を設計し,高効率な2段階推論を実現する。
- 参考スコア(独自算出の注目度): 44.07301075351432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human trajectory prediction is a practical task of predicting the future positions of pedestrians on the road, which typically covers all temporal ranges from short-term to long-term within a trajectory. However, existing works attempt to address the entire trajectory prediction with a singular, uniform training paradigm, neglecting the distinction between short-term and long-term dynamics in human trajectories. To overcome this limitation, we introduce a novel Progressive Pretext Task learning (PPT) framework, which progressively enhances the model's capacity of capturing short-term dynamics and long-term dependencies for the final entire trajectory prediction. Specifically, we elaborately design three stages of training tasks in the PPT framework. In the first stage, the model learns to comprehend the short-term dynamics through a stepwise next-position prediction task. In the second stage, the model is further enhanced to understand long-term dependencies through a destination prediction task. In the final stage, the model aims to address the entire future trajectory task by taking full advantage of the knowledge from previous stages. To alleviate the knowledge forgetting, we further apply a cross-task knowledge distillation. Additionally, we design a Transformer-based trajectory predictor, which is able to achieve highly efficient two-step reasoning by integrating a destination-driven prediction strategy and a group of learnable prompt embeddings. Extensive experiments on popular benchmarks have demonstrated that our proposed approach achieves state-of-the-art performance with high efficiency. Code is available at https://github.com/iSEE-Laboratory/PPT.
- Abstract(参考訳): 人間軌道予測は、道路上の歩行者の将来の位置を予測するための実践的なタスクであり、通常は軌道内の短期から長期までの時間範囲をカバーしている。
しかし、既存の研究は、人間の軌跡における短期力学と長期力学の区別を無視して、特異で均一な訓練パラダイムで軌道予測全体を解決しようと試みている。
この制限を克服するため,我々は,PPT(Progressive Pretext Task Learning)フレームワークを導入した。
具体的には,PTフレームワークにおける3段階のトレーニングタスクを精巧に設計する。
最初の段階では、ステップワイズな次位置予測タスクを通じて、短期的なダイナミクスを理解することを学習する。
第2段階では、目的地予測タスクを通じて長期的な依存関係を理解するために、モデルをさらに強化する。
最終段階では、前段階からの知識を最大限に活用することで、将来の軌道上の課題に対処することを目的としている。
忘れる知識を緩和するために、クロスタスクな知識蒸留を更に適用する。
さらに,トランスフォーマーをベースとした軌道予測器を設計し,目的地駆動予測戦略と学習可能なプロンプト埋め込みのグループを統合することにより,高い効率の2段階推論を実現する。
一般的なベンチマーク実験により,提案手法が最先端の性能を高い効率で達成できることが実証された。
コードはhttps://github.com/iSEE-Laboratory/PPTで入手できる。
関連論文リスト
- Distilling Knowledge for Short-to-Long Term Trajectory Prediction [9.626916225081613]
長期軌道予測はコンピュータビジョン、機械学習、ロボット工学の分野において重要な問題である。
本稿では,学生ネットワークに長期軌跡予測を誘導する短期軌跡モデル予測器の蒸留を利用する新しい手法であるDi-Longを提案する。
実験の結果,提案手法は長期予測に有効であり,最先端の性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2023-05-15T11:30:28Z) - Waypoint Models for Instruction-guided Navigation in Continuous
Environments [68.2912740006109]
本稿では,言語条件付きウェイポイント予測ネットワークのクラスを開発し,この問題について検討する。
プロファイリングされたLoCoBotロボット上でのタスク性能と実行時間の推定を行う。
我々のモデルは、VLN-CEにおける以前の仕事を上回り、新しい最先端の技術を公衆のリーダーボードに置きました。
論文 参考訳(メタデータ) (2021-10-05T17:55:49Z) - Learning to Predict Vehicle Trajectories with Model-based Planning [43.27767693429292]
PRIME(Prediction with Model-based Planning)という新しいフレームワークを紹介します。
ニューラルネットワークを使ってシーンコンテキストをモデル化する最近の予測作業とは異なり、PRIMEは正確で実現可能な将来の軌道予測を生成するように設計されている。
我々のPRIMEは、不完全追跡下での予測精度、実現可能性、堅牢性において最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-03-06T04:49:24Z) - From Goals, Waypoints & Paths To Long Term Human Trajectory Forecasting [54.273455592965355]
将来の軌道の不確実性は、(a)エージェントに知られているが、モデルに未知な情報源、例えば長期目標や(b)エージェントとモデルの両方に未知な情報源、例えば他のエージェントの意図や既約乱数不確定性などである。
我々は,長期目標における多モータリティと,経路ポイントや経路における多モータリティによるアレタリック不確実性を通じて,てんかん不確かさをモデル化する。
また,この二分法を実証するために,従来の作業よりも1分間,桁長の予測地平線を有する,新しい長期軌跡予測設定を提案する。
論文 参考訳(メタデータ) (2020-12-02T21:01:29Z) - Goal-driven Long-Term Trajectory Prediction [30.054850639996033]
本稿では,歩行者の目標を決定する仮説的プロセスと,そのプロセスが長期的将来の軌道に与える影響をモデル化することを提案する。
このような直感を実現するデュアルチャネルニューラルネットワークであるゴール駆動軌道予測モデルを設計する。
モデルは様々な環境で、特に大きな予測地平線において、最先端のモデルよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-05T10:47:33Z) - LTN: Long-Term Network for Long-Term Motion Prediction [0.0]
長期ネットワーク(LTN)と呼ばれる長期軌道予測のための2段階フレームワークを提案する。
まず,条件付き変分オートエンコーダ(CVAE)を用いて提案したトラジェクトリの集合を生成し,それらをバイナリラベルで分類し,最も高いスコアでトラジェクトリを出力する。
その結果,提案手法は,長期軌道予測における複数の最先端手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2020-10-15T17:59:09Z) - TNT: Target-driveN Trajectory Prediction [76.21200047185494]
我々は移動エージェントのための目標駆動軌道予測フレームワークを開発した。
我々は、車や歩行者の軌道予測をベンチマークする。
私たちはArgoverse Forecasting、InterAction、Stanford Drone、および社内のPedestrian-at-Intersectionデータセットの最先端を達成しています。
論文 参考訳(メタデータ) (2020-08-19T06:52:46Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。