論文の概要: MoFlow: One-Step Flow Matching for Human Trajectory Forecasting via Implicit Maximum Likelihood Estimation based Distillation
- arxiv url: http://arxiv.org/abs/2503.09950v1
- Date: Thu, 13 Mar 2025 01:53:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-14 15:55:13.637528
- Title: MoFlow: One-Step Flow Matching for Human Trajectory Forecasting via Implicit Maximum Likelihood Estimation based Distillation
- Title(参考訳): MoFlow:1ステップのフローマッチングによる最大容積推定による人軌道予測
- Authors: Yuxiang Fu, Qi Yan, Lele Wang, Ke Li, Renjie Liao,
- Abstract要約: そこで本研究では,シーン内のすべてのエージェントに対するKショットの将来の軌跡を予測するために,MoFlowと呼ばれる新しい動き予測条件付きフローマッチングモデルを提案する。
暗黙的最大推定(IMLE)を利用して,教師モデルからのサンプルのみを必要とする流れモデルの新しい蒸留法を提案する。
SportVU NBAゲーム、ETH-UCY、SDDといった実世界のデータセットの実験は、我々の教師フローモデルとIMLE蒸留された学生モデルの両方が最先端のパフォーマンスを達成することを実証している。
- 参考スコア(独自算出の注目度): 15.812310202826902
- License:
- Abstract: In this paper, we address the problem of human trajectory forecasting, which aims to predict the inherently multi-modal future movements of humans based on their past trajectories and other contextual cues. We propose a novel motion prediction conditional flow matching model, termed MoFlow, to predict K-shot future trajectories for all agents in a given scene. We design a novel flow matching loss function that not only ensures at least one of the $K$ sets of future trajectories is accurate but also encourages all $K$ sets of future trajectories to be diverse and plausible. Furthermore, by leveraging the implicit maximum likelihood estimation (IMLE), we propose a novel distillation method for flow models that only requires samples from the teacher model. Extensive experiments on the real-world datasets, including SportVU NBA games, ETH-UCY, and SDD, demonstrate that both our teacher flow model and the IMLE-distilled student model achieve state-of-the-art performance. These models can generate diverse trajectories that are physically and socially plausible. Moreover, our one-step student model is $\textbf{100}$ times faster than the teacher flow model during sampling. The code, model, and data are available at our project page: https://moflow-imle.github.io
- Abstract(参考訳): 本稿では,過去の軌跡や文脈的手がかりに基づいて,人間の自然に多モーダルな将来の動きを予測することを目的とした,人間の軌跡予測の課題に対処する。
そこで本研究では,シーン内のすべてのエージェントに対するKショットの将来の軌跡を予測するために,MoFlowと呼ばれる新しい動き予測条件付きフローマッチングモデルを提案する。
我々は、将来の軌跡の少なくとも1つの$K$集合が正確であることを保証するだけでなく、将来の軌跡のすべての$K$集合が多様かつ実証可能であることを保証できる新しいフローマッチング損失関数を設計する。
さらに,暗黙的最大推定(IMLE)を利用して,教師モデルからのサンプルのみを必要とする流れモデルの新しい蒸留法を提案する。
SportVU NBAゲーム、ETH-UCY、SDDなどの実世界のデータセットに対する大規模な実験は、我々の教師フローモデルとIMLE蒸留された学生モデルの両方が最先端のパフォーマンスを達成することを実証している。
これらのモデルは、物理的かつ社会的に妥当な様々な軌道を生成することができる。
さらに、我々の一段階の学生モデルは、サンプリング中の教師フローモデルよりも、$\textbf{100}$倍高速である。
コード、モデル、データは、プロジェクトのページで利用可能です。
関連論文リスト
- Humanoid Locomotion as Next Token Prediction [84.21335675130021]
我々のモデルは感覚運動軌道の自己回帰予測によって訓練された因果変換器である。
われわれのモデルでは、フルサイズのヒューマノイドがサンフランシスコでゼロショットで歩けることが示されている。
われわれのモデルは、わずか27時間の歩行データで訓練された場合でも現実世界に移行でき、後方歩行のような訓練中に見えないコマンドを一般化することができる。
論文 参考訳(メタデータ) (2024-02-29T18:57:37Z) - A Complete Recipe for Bayesian Knowledge Transfer: Object Tracking [3.60953887026184]
対象がモデルを選択し、従うことができるモデルジャンプを考慮に入れた、新しいベイズモデルを導入する。
我々は,対象オブジェクトへの逐次転送中に,対象オブジェクトの軌跡を追跡することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T00:11:36Z) - Not All Models Are Equal: Predicting Model Transferability in a
Self-challenging Fisher Space [51.62131362670815]
本稿では、トレーニング済みのディープニューラルネットワークのランク付けと、下流タスクにおける最も転送可能なニューラルネットワークのスクリーニングの問題に対処する。
textbfSelf-challenging textbfFisher textbfDiscriminant textbfAnalysis (textbfSFDA)と呼ばれる新しい転送可能性指標を提案する。
論文 参考訳(メタデータ) (2022-07-07T01:33:25Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - FloMo: Tractable Motion Prediction with Normalizing Flows [0.0]
ノイズサンプルと将来の動き分布の正規化フローによる密度推定問題として動作予測をモデル化する。
我々のモデルはFloMoと呼ばれ、単一のネットワークパスで確率を計算でき、最大推定で直接訓練することができる。
提案手法は,3つの一般的な予測データセットにおいて最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-03-05T11:35:27Z) - LogME: Practical Assessment of Pre-trained Models for Transfer Learning [80.24059713295165]
最大エビデンス対数(logme)は、転送学習のための事前学習されたモデルを評価するために用いられる。
ブルートフォースの微調整と比較して、LogMEはウォールクロックタイムで3000times$のスピードアップをもたらします。
論文 参考訳(メタデータ) (2021-02-22T13:58:11Z) - Diverse Sampling for Normalizing Flow Based Trajectory Forecasting [34.01303881881315]
本研究では,事前学習フローモデルからトラジェクトリサンプルの品質と多様性を向上させるため,DSF(Diversity Smpling for Flow)を提案する。
DSFは実装が容易であり、既存のフローベースの予測モデルに対して、シンプルなプラグインの改善を提供する。
論文 参考訳(メタデータ) (2020-11-30T18:23:29Z) - Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。
トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文 参考訳(メタデータ) (2020-10-27T17:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。