論文の概要: A Spatio-temporal Continuous Network for Stochastic 3D Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2508.01585v1
- Date: Sun, 03 Aug 2025 04:53:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.952179
- Title: A Spatio-temporal Continuous Network for Stochastic 3D Human Motion Prediction
- Title(参考訳): 確率的3次元動作予測のための時空間連続ネットワーク
- Authors: Hua Yu, Yaqing Hou, Xu Gui, Shanshan Feng, Dongsheng Zhou, Qiang Zhang,
- Abstract要約: 本研究では,2段階からなる連続的な人間の動作予測のためのSTCと呼ばれる新しい手法を提案する。
最初の段階では、よりスムーズな人間の動き列を生成するための時間的連続ネットワークを提案する。
第2段階では、STCNは観測された動き列のガウス混合分布(GMM)を取得する。
- 参考スコア(独自算出の注目度): 15.033378809142299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stochastic Human Motion Prediction (HMP) has received increasing attention due to its wide applications. Despite the rapid progress in generative fields, existing methods often face challenges in learning continuous temporal dynamics and predicting stochastic motion sequences. They tend to overlook the flexibility inherent in complex human motions and are prone to mode collapse. To alleviate these issues, we propose a novel method called STCN, for stochastic and continuous human motion prediction, which consists of two stages. Specifically, in the first stage, we propose a spatio-temporal continuous network to generate smoother human motion sequences. In addition, the anchor set is innovatively introduced into the stochastic HMP task to prevent mode collapse, which refers to the potential human motion patterns. In the second stage, STCN endeavors to acquire the Gaussian mixture distribution (GMM) of observed motion sequences with the aid of the anchor set. It also focuses on the probability associated with each anchor, and employs the strategy of sampling multiple sequences from each anchor to alleviate intra-class differences in human motions. Experimental results on two widely-used datasets (Human3.6M and HumanEva-I) demonstrate that our model obtains competitive performance on both diversity and accuracy.
- Abstract(参考訳): HMP(Stochastic Human Motion Prediction)はその幅広い応用により注目されている。
生成分野の急速な進歩にもかかわらず、既存の手法はしばしば、連続的な時間的ダイナミクスの学習と確率的な動き列の予測において困難に直面している。
彼らは複雑な人間の動きに固有の柔軟性を見落とし、モード崩壊する傾向がある。
これらの問題を緩和するために,2段階からなる確率的かつ連続的な人間の動作予測のためのSTCNという新しい手法を提案する。
具体的には、第1段階において、よりスムーズな人間の動作シーケンスを生成するための時空間連続ネットワークを提案する。
さらに、アンカーセットを確率的HMPタスクに革新的に導入して、潜在的な人間の動作パターンを参照するモード崩壊を防止する。
第2段階では、STCNはアンカーセットの助けを借りて観測された動き列のガウス混合分布(GMM)を取得する。
また、各アンカーに関連する確率に焦点を当て、各アンカーから複数の配列をサンプリングし、人間の動作におけるクラス内差を軽減する戦略を採用している。
Human3.6MとHumanEva-Iの2つの広く使われているデータセットに対する実験結果から,本モデルが多様性と精度の両面での競争性能を得ることが示された。
関連論文リスト
- ManiGaussian++: General Robotic Bimanual Manipulation with Hierarchical Gaussian World Model [52.02220087880269]
本稿では,階層的世界モデルを用いてマルチタスクシーンのダイナミックスを消化することにより,双方向操作を改善するManiGaussianフレームワークの拡張を提案する。
提案手法は,シミュレーションタスク10件で20.2%,実世界の課題9件で平均60%の成功率で,最先端のバイマニュアル操作技術よりも優れていた。
論文 参考訳(メタデータ) (2025-06-24T17:59:06Z) - GENMO: A GENeralist Model for Human MOtion [64.16188966024542]
本稿では,1つのフレームワークで動作推定と生成を橋渡しする汎用人体運動モデル GENMO を提案する。
我々の重要な洞察は、出力運動が観測された条件信号を正確に満たさなければならないような制約された動き生成として運動推定を再構成することである。
我々の新しいアーキテクチャは、可変長動きと混合マルチモーダル条件(テキスト、オーディオ、ビデオ)を異なる時間間隔で処理し、柔軟な制御を提供する。
論文 参考訳(メタデータ) (2025-05-02T17:59:55Z) - Deterministic-to-Stochastic Diverse Latent Feature Mapping for Human Motion Synthesis [31.082402451716973]
人間の動作合成は、人間の動作シーケンスを生成することを目的としている。
近年のスコアベース生成モデル (SGM) は, この課題に対して顕著な成果を上げている。
本研究では,人間の動作合成のための決定論的-確率的横性特徴マッピング法(DSDFM)を提案する。
論文 参考訳(メタデータ) (2025-05-02T04:48:28Z) - DivDiff: A Conditional Diffusion Model for Diverse Human Motion Prediction [9.447439259813112]
本研究では,より多様で現実的な人間の動きを予測するために,DivDiffと呼ばれる条件拡散に基づく生成モデルを提案する。
具体的には、DivDiffはDDPMをバックボーンとして使用し、離散コサイン変換(DCT)とトランスフォーマー機構を組み込んでいます。
本研究では,人体運動に対する人間の骨格制約を強制するために,多種多様な強化サンプリング機能 (DRSF) を設計する。
論文 参考訳(メタデータ) (2024-08-16T04:51:32Z) - Priority-Centric Human Motion Generation in Discrete Latent Space [59.401128190423535]
テキスト・ツー・モーション生成のための優先中心運動離散拡散モデル(M2DM)を提案する。
M2DMは、コード崩壊に対処するために、グローバルな自己注意機構と正規化用語を組み込んでいる。
また、各動きトークンの重要度から決定される革新的なノイズスケジュールを用いた動き離散拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-08-28T10:40:16Z) - Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal
Anchors [21.915057426589744]
本稿では,サンプルの精度と多様性を促進するために,ランダムなサンプルコードと,決定論的に学習可能なコンポーネントであるアンカーを分離する,単純かつ効果的なアプローチを提案する。
原則として、時空間アンカーベースサンプリング(STARS)は、異なる動き予測器に適用できる。
論文 参考訳(メタデータ) (2023-02-09T18:58:07Z) - Executing your Commands via Motion Diffusion in Latent Space [51.64652463205012]
本研究では,動作遅延に基づく拡散モデル(MLD)を提案し,条件付き入力に対応する鮮明な動き列を生成する。
我々のMDDは、広範囲な人体運動生成タスクにおいて、最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-08T03:07:00Z) - BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction [26.306489700180627]
本研究では,人間の動作予測(HMP)における潜伏拡散モデルを利用して,行動がポーズや動きから切り離されている潜伏空間からサンプルを採取するモデルであるBeLFusionを提案する。
サンプルの動作を進行中の動作に転送する能力のおかげで、Belfusion氏の予測は、芸術の状況よりもはるかに現実的なさまざまな行動を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:03Z) - Weakly-supervised Action Transition Learning for Stochastic Human Motion
Prediction [81.94175022575966]
動作駆動型人間の動作予測の課題について紹介する。
一連の動作ラベルと短い動作履歴から、複数の可算な将来の動作を予測することを目的としている。
論文 参考訳(メタデータ) (2022-05-31T08:38:07Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Learning to Predict Diverse Human Motions from a Single Image via
Mixture Density Networks [9.06677862854201]
本研究では,混合密度ネットワーク(MDN)モデルを用いて,単一画像から将来の人間の動きを予測する新しい手法を提案する。
MDNのマルチモーダルな性質は、既存のディープヒューマンモーション予測アプローチとは対照的に、様々な将来のモーション仮説の生成を可能にしている。
訓練されたモデルでは、入力として画像を直接取り、与えられた条件を満たす複数の可視運動を生成する。
論文 参考訳(メタデータ) (2021-09-13T08:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。