論文の概要: CacheFlow: Fast Human Motion Prediction by Cached Normalizing Flow
- arxiv url: http://arxiv.org/abs/2505.13140v1
- Date: Mon, 19 May 2025 14:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.636329
- Title: CacheFlow: Fast Human Motion Prediction by Cached Normalizing Flow
- Title(参考訳): CacheFlow:キャッシュ正規化フローによる高速な人体動作予測
- Authors: Takahiro Maeda, Jinkun Cao, Norimichi Ukita, Kris Kitani,
- Abstract要約: 本稿では,新しいフローベース手法であるCacheFlowを提案する。
時間効率に苦しむ従来の条件付き生成モデルとは異なり、CacheFlowは無条件のフローベースの生成モデルを利用する。
提案手法は,Human3.6M上のSOTA法に比較して,密度推定精度と予測精度が向上したことを示す。
- 参考スコア(独自算出の注目度): 38.74038236608644
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many density estimation techniques for 3D human motion prediction require a significant amount of inference time, often exceeding the duration of the predicted time horizon. To address the need for faster density estimation for 3D human motion prediction, we introduce a novel flow-based method for human motion prediction called CacheFlow. Unlike previous conditional generative models that suffer from time efficiency, CacheFlow takes advantage of an unconditional flow-based generative model that transforms a Gaussian mixture into the density of future motions. The results of the computation of the flow-based generative model can be precomputed and cached. Then, for conditional prediction, we seek a mapping from historical trajectories to samples in the Gaussian mixture. This mapping can be done by a much more lightweight model, thus saving significant computation overhead compared to a typical conditional flow model. In such a two-stage fashion and by caching results from the slow flow model computation, we build our CacheFlow without loss of prediction accuracy and model expressiveness. This inference process is completed in approximately one millisecond, making it 4 times faster than previous VAE methods and 30 times faster than previous diffusion-based methods on standard benchmarks such as Human3.6M and AMASS datasets. Furthermore, our method demonstrates improved density estimation accuracy and comparable prediction accuracy to a SOTA method on Human3.6M. Our code and models will be publicly available.
- Abstract(参考訳): 人間の3次元運動予測のための多くの密度推定手法は、予測された時間水平線の時間を超え、かなりの量の推測時間を必要とする。
本研究では,3次元動作予測のための高速な密度推定の必要性に対処するため,キャッシュフローと呼ばれる新しいフローベース手法を提案する。
時間効率に苦しむ以前の条件生成モデルとは異なり、CacheFlowは、ガウス混合を将来の動きの密度に変換する非条件フローベースの生成モデルを利用する。
フローベース生成モデルの計算結果を事前計算し、キャッシュすることができる。
そこで, 条件付き予測では, 歴史的軌跡からガウス混合試料への写像を求める。
このマッピングはより軽量なモデルで行うことができ、典型的な条件付きフローモデルと比較して計算オーバーヘッドを大幅に削減できる。
このような2段階の方法で、スローフローモデル計算の結果をキャッシュすることで、予測精度とモデル表現性を損なうことなくCacheFlowを構築します。
この推論プロセスは約1ミリ秒で完了し、従来のVAE法よりも4倍速く、Human3.6M や AMASS などの標準ベンチマークでは30倍高速である。
さらに,Human3.6MにおけるSOTA法に比較して,密度推定精度と予測精度が向上したことを示す。
私たちのコードとモデルは公開されます。
関連論文リスト
- Mean Flows for One-step Generative Modeling [64.4997821467102]
本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。
ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。
提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文 参考訳(メタデータ) (2025-05-19T17:59:42Z) - Gaussian Mixture Flow Matching Models [51.976452482535954]
拡散モデルは正規分布をガウス平均として近似し,その平均を推定する一方,フローマッチングモデルはガウス平均をフロー速度としてパラメータ化する。
離散化誤差による数段階のサンプリングでは性能が低下し、分類器フリーガイダンス(CFG)では過飽和色が生じる傾向にある。
本稿では,CFGの過飽和問題を緩和し,画像生成品質を向上する新しい確率的ガイダンス手法を提案する。
論文 参考訳(メタデータ) (2025-04-07T17:59:42Z) - Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing [10.542645300983878]
本稿では,事前学習した流れモデルに対する推論時間スケーリング手法を提案する。
本稿では,SDE に基づく生成,特に分散保存型 (VP) 補間型 (VP) 生成は,フローモデルにおける推論時間スケーリングのための粒子サンプリング法を改善することを示す。
論文 参考訳(メタデータ) (2025-03-25T06:30:45Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Fast Inference and Update of Probabilistic Density Estimation on
Trajectory Prediction [19.240717471864723]
自動運転車や社会ロボットのような安全クリティカルな応用には、高速な計算と正確な確率密度推定が必要である。
本稿では,フローチェインという新しい正規化フローベース軌道予測モデルを提案する。
FlowChainは、カーネル密度推定のような追加の近似を必要とする生成モデルよりも高速である。
論文 参考訳(メタデータ) (2023-08-17T07:16:21Z) - FloMo: Tractable Motion Prediction with Normalizing Flows [0.0]
ノイズサンプルと将来の動き分布の正規化フローによる密度推定問題として動作予測をモデル化する。
我々のモデルはFloMoと呼ばれ、単一のネットワークパスで確率を計算でき、最大推定で直接訓練することができる。
提案手法は,3つの一般的な予測データセットにおいて最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-03-05T11:35:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。