論文の概要: Distilling Knowledge for Short-to-Long Term Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2305.08553v1
- Date: Mon, 15 May 2023 11:30:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 14:55:09.930712
- Title: Distilling Knowledge for Short-to-Long Term Trajectory Prediction
- Title(参考訳): 短期軌跡予測のための蒸留知識
- Authors: Sourav Das and Guglielmo Camporese and Lamberto Ballan
- Abstract要約: 長期軌跡予測のためのDi-Long(長期軌跡蒸留)と呼ばれる新しい手法を提案する。
本手法では,長期的軌道予測問題を解決するために,学生ネットワークを訓練する。
我々は,教師モデルを用いて,より短い時間地平線で可塑性軌道を生成するとともに,教師モデルから生徒モデルに知識を蒸留し,より高い時間地平線で問題を解く。
- 参考スコア(独自算出の注目度): 6.4348624502584615
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Long-term trajectory forecasting is a challenging problem in the field of
computer vision and machine learning. In this paper, we propose a new method
dubbed Di-Long ("Distillation for Long-Term trajectory") for long-term
trajectory forecasting, which is based on knowledge distillation. Our approach
involves training a student network to solve the long-term trajectory
forecasting problem, whereas the teacher network from which the knowledge is
distilled has a longer observation, and solves a short-term trajectory
prediction problem by regularizing the student's predictions. Specifically, we
use a teacher model to generate plausible trajectories for a shorter time
horizon, and then distill the knowledge from the teacher model to a student
model that solves the problem for a much higher time horizon. Our experiments
show that the proposed Di-Long approach is beneficial for long-term
forecasting, and our model achieves state-of-the-art performance on the
Intersection Drone Dataset (inD) and the Stanford Drone Dataset (SDD).
- Abstract(参考訳): 長期軌跡予測はコンピュータビジョンと機械学習の分野で難しい問題である。
本稿では,知識蒸留に基づく長期軌跡予測のためのDi-Long(長期軌跡蒸留)と呼ばれる新しい手法を提案する。
本手法では,長期的軌道予測問題を解くために学生ネットワークを訓練するが,知識を蒸留した教師ネットワークは観察期間が長く,生徒の予測を定式化することにより短期的軌道予測問題を解く。
具体的には,教師モデルを用いて,より短い時間軸に対して妥当な軌跡を生成し,その知識を教師モデルからより高い時間軸で問題を解く学生モデルに抽出する。
実験により,提案手法は長期予測に有用であることが確認された。本モデルは,Intersection Drone Dataset (inD) とStanford Drone Dataset (SDD) の最先端性能を実現する。
関連論文リスト
- Progressive Pretext Task Learning for Human Trajectory Prediction [44.07301075351432]
本稿では,PPT(Progressive Pretext Task Learning)フレームワークについて紹介する。
トランスフォーマーを用いたトラジェクトリ予測器を設計し,高効率な2段階推論を実現する。
論文 参考訳(メタデータ) (2024-07-16T10:48:18Z) - Self-Supervised Contrastive Learning for Long-term Forecasting [41.11757636744812]
長期予測は、時間とメモリの複雑さによる固有の課題を示す。
スライドウィンドウに頼って長いシーケンスを処理している既存の手法は、長期の変動を効果的に捉えるのに苦労している。
コントラスト学習と拡張分解アーキテクチャを用いて,この制限を克服する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-03T04:32:34Z) - Temporal DINO: A Self-supervised Video Strategy to Enhance Action
Prediction [15.696593695918844]
本稿では、DINOにインスパイアされた行動予測(ラベルのない自己蒸留)を強化するための、新しい自己教師型ビデオ戦略を提案する。
実験結果は、3D-ResNet、Transformer、LSTMアーキテクチャで予測性能が大幅に向上したことを示している。
これらの知見は,行動認識,運動計画,シーン理解など,多様な映像ベースタスクにおけるアプローチの可能性を強調した。
論文 参考訳(メタデータ) (2023-08-08T21:18:23Z) - Multiscale Video Pretraining for Long-Term Activity Forecasting [67.06864386274736]
マルチスケールビデオプレトレーニングは、複数の時間スケールで将来のビデオクリップの文脈化された表現を予測することを学ぶことによって、予測のための堅牢な表現を学習する。
MVPは、ビデオ内のアクションは、通常、短い時間スケールでアトミックアクションが起こり、より複雑なアクションがより長い時間スケールで発生する、マルチスケールな性質を持つ、という私たちの観察に基づいています。
Ego4DとEpic-Kitchens-55/100データセットにわたる包括的な実験では、MVPが最先端のメソッドをかなりのマージンで上回っていることが示されています。
論文 参考訳(メタデータ) (2023-07-24T14:55:15Z) - Improving Long-Horizon Imitation Through Instruction Prediction [93.47416552953075]
本研究では、しばしば使われない補助的監督源である言語の使用について検討する。
近年のトランスフォーマーモデルの発展にインスパイアされたエージェントは,高レベルの抽象化で動作する時間拡張表現の学習を促す命令予測損失を持つエージェントを訓練する。
さらなる分析では、複雑な推論を必要とするタスクにおいて、命令モデリングが最も重要であり、単純な計画を必要とする環境において、より小さなゲインを提供する。
論文 参考訳(メタデータ) (2023-06-21T20:47:23Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z) - From Goals, Waypoints & Paths To Long Term Human Trajectory Forecasting [54.273455592965355]
将来の軌道の不確実性は、(a)エージェントに知られているが、モデルに未知な情報源、例えば長期目標や(b)エージェントとモデルの両方に未知な情報源、例えば他のエージェントの意図や既約乱数不確定性などである。
我々は,長期目標における多モータリティと,経路ポイントや経路における多モータリティによるアレタリック不確実性を通じて,てんかん不確かさをモデル化する。
また,この二分法を実証するために,従来の作業よりも1分間,桁長の予測地平線を有する,新しい長期軌跡予測設定を提案する。
論文 参考訳(メタデータ) (2020-12-02T21:01:29Z) - LTN: Long-Term Network for Long-Term Motion Prediction [0.0]
長期ネットワーク(LTN)と呼ばれる長期軌道予測のための2段階フレームワークを提案する。
まず,条件付き変分オートエンコーダ(CVAE)を用いて提案したトラジェクトリの集合を生成し,それらをバイナリラベルで分類し,最も高いスコアでトラジェクトリを出力する。
その結果,提案手法は,長期軌道予測における複数の最先端手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2020-10-15T17:59:09Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。