論文の概要: Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal
Anchors
- arxiv url: http://arxiv.org/abs/2302.04860v1
- Date: Thu, 9 Feb 2023 18:58:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 14:30:32.801574
- Title: Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal
Anchors
- Title(参考訳): 多層空間型アンカーによる多面体動作予測
- Authors: Sirui Xu, Yu-Xiong Wang, Liang-Yan Gui
- Abstract要約: 本稿では,サンプルの精度と多様性を促進するために,ランダムなサンプルコードと,決定論的に学習可能なコンポーネントであるアンカーを分離する,単純かつ効果的なアプローチを提案する。
原則として、時空間アンカーベースサンプリング(STARS)は、異なる動き予測器に適用できる。
- 参考スコア(独自算出の注目度): 21.915057426589744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting diverse human motions given a sequence of historical poses has
received increasing attention. Despite rapid progress, existing work captures
the multi-modal nature of human motions primarily through likelihood-based
sampling, where the mode collapse has been widely observed. In this paper, we
propose a simple yet effective approach that disentangles randomly sampled
codes with a deterministic learnable component named anchors to promote sample
precision and diversity. Anchors are further factorized into spatial anchors
and temporal anchors, which provide attractively interpretable control over
spatial-temporal disparity. In principle, our spatial-temporal anchor-based
sampling (STARS) can be applied to different motion predictors. Here we propose
an interaction-enhanced spatial-temporal graph convolutional network (IE-STGCN)
that encodes prior knowledge of human motions (e.g., spatial locality), and
incorporate the anchors into it. Extensive experiments demonstrate that our
approach outperforms state of the art in both stochastic and deterministic
prediction, suggesting it as a unified framework for modeling human motions.
Our code and pretrained models are available at
https://github.com/Sirui-Xu/STARS.
- Abstract(参考訳): 一連の歴史的なポーズによって多様な人間の動きを予測することが注目されている。
急速な進歩にもかかわらず、既存の研究は、主にモード崩壊が広く観測されている可能性に基づくサンプリングを通して、人間の動作のマルチモーダルな性質を捉えている。
本稿では,アンカーと呼ばれる決定論的学習可能なコンポーネントでランダムにサンプリングされたコードを分離し,サンプル精度と多様性を促進する,単純かつ効果的な手法を提案する。
アンカーはさらに空間的アンカーと時間的アンカーに分解され、空間的時間的格差に対する魅力的な制御を提供する。
原則として、時空間アンカーベースサンプリング(STARS)は、異なる動き予測器に適用できる。
本稿では,人間の運動(例えば空間的局所性)の事前知識を符号化し,アンカーを組み込む対話型時空間グラフ畳み込みネットワーク(ie-stgcn)を提案する。
大規模な実験により,人間の動きをモデル化するための統一的な枠組みとして,確率的,決定論的両方の予測において,我々のアプローチが技術の現状より優れていることが示された。
私たちのコードと事前訓練されたモデルはhttps://github.com/Sirui-Xu/STARS.comで公開されています。
関連論文リスト
- Multiscale Residual Learning of Graph Convolutional Sequence Chunks for
Human Motion Prediction [23.212848643552395]
時間的および空間的依存関係の学習による人間の動作予測のための新しい手法を提案する。
提案手法は,動作予測のためのシーケンス情報を効果的にモデル化し,他の手法よりも優れ,新しい最先端の手法を設定できる。
論文 参考訳(メタデータ) (2023-08-31T15:23:33Z) - Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - A Neuro-Symbolic Approach for Enhanced Human Motion Prediction [5.742409080817885]
人間の動作予測のためのニューロシンボリックアプローチ(NeuroSyM)を提案する。
NeuroSyMは、質的軌道計算(QTC)と呼ばれる空間表現に直感的手法を活用することにより、近隣の相互作用を異なる重み付けする
実験の結果,NeuroSyMアプローチは,ほとんどの場合,予測精度においてベースラインアーキテクチャよりも優れていた。
論文 参考訳(メタデータ) (2023-04-23T20:11:40Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - Skeleton-Based Action Segmentation with Multi-Stage Spatial-Temporal
Graph Convolutional Neural Networks [0.5156484100374059]
最先端のアクションセグメンテーションアプローチは、時間的畳み込みの複数の段階を使用する。
多段階時空間グラフ畳み込みニューラルネットワーク(MS-GCN)を提案する。
時間的畳み込みの初期段階を空間的時間的グラフ畳み込みに置き換え、関節の空間的構成をよりよく活用する。
論文 参考訳(メタデータ) (2022-02-03T17:42:04Z) - Motion Prediction via Joint Dependency Modeling in Phase Space [40.54430409142653]
我々は、運動解剖学の明示的な事前知識を活用するために、新しい畳み込みニューラルモデルを導入する。
次に,個々の関節機能間の暗黙的関係を学習するグローバル最適化モジュールを提案する。
本手法は,大規模な3次元人体動作ベンチマークデータセットを用いて評価する。
論文 参考訳(メタデータ) (2022-01-07T08:30:01Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Generating Smooth Pose Sequences for Diverse Human Motion Prediction [90.45823619796674]
本稿では,多様な動作予測と制御可能な動作予測のための統合された深部生成ネットワークを提案する。
標準ベンチマークデータセットであるHuman3.6MとHumanEva-Iの2つの実験は、我々のアプローチがサンプルの多様性と精度の両方において最先端のベースラインより優れていることを示した。
論文 参考訳(メタデータ) (2021-08-19T00:58:00Z) - Long Term Motion Prediction Using Keyposes [122.22758311506588]
長期的な予測を達成するには、瞬時に人間のポーズを予測する必要があると論じている。
このようなポーズを「キーポス」と呼び、後続のキーポスを線形に補間して近似する複素運動と呼ぶ。
このようなキープレースのシーケンスを学習することで,将来的には最大5秒まで,非常に長期にわたる動作を予測できることが示される。
論文 参考訳(メタデータ) (2020-12-08T20:45:51Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。