論文の概要: Forecasting Characteristic 3D Poses of Human Actions
- arxiv url: http://arxiv.org/abs/2011.15079v2
- Date: Wed, 7 Apr 2021 17:58:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 14:57:36.805346
- Title: Forecasting Characteristic 3D Poses of Human Actions
- Title(参考訳): 人間の行動の特徴的3次元ポーズの予測
- Authors: Christian Diller, Thomas Funkhouser, Angela Dai
- Abstract要約: 本研究では,人物のモノクロ映像から特徴的3Dポーズを予測し,その人物の将来的な3Dポーズを,アクション定義可能な特徴的ポーズで予測するタスクを提案する。
我々は、目標指向行動からインスピレーションを得て、予測されたポーズを時間から切り離す意味論的に意味のあるポーズ予測タスクを定義する。
このデータセットを用いた実験により,提案手法は最先端手法を平均22%上回る確率的手法であることが示唆された。
- 参考スコア(独自算出の注目度): 24.186058965796157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose the task of forecasting characteristic 3D poses: from a monocular
video observation of a person, to predict a future 3D pose of that person in a
likely action-defining, characteristic pose - for instance, from observing a
person reaching for a banana, predict the pose of the person eating the banana.
Prior work on human motion prediction estimates future poses at fixed time
intervals. Although easy to define, this frame-by-frame formulation confounds
temporal and intentional aspects of human action. Instead, we define a
semantically meaningful pose prediction task that decouples the predicted pose
from time, taking inspiration from goal-directed behavior. To predict
characteristic poses, we propose a probabilistic approach that first models the
possible multi-modality in the distribution of likely characteristic poses. It
then samples future pose hypotheses from the predicted distribution in an
autoregressive fashion to model dependencies between joints and finally
optimizes the resulting pose with bone length and angle constraints. To
evaluate our method, we construct a dataset of manually annotated
characteristic 3D poses. Our experiments with this dataset suggest that our
proposed probabilistic approach outperforms state-of-the-art methods by 22% on
average.
- Abstract(参考訳): 例えば,バナナに手を伸ばす人物を観察し,バナナを食べている人のポーズを予測することで,その人物の将来の3Dポーズを予測する。
人間の運動予測推定に関する事前の作業は、一定の時間間隔で行われる。
このフレーム・バイ・フレームの定式化は簡単に定義できるが、人間の行動の時間的側面と意図的な側面に矛盾する。
代わりに、目標指向の行動からインスピレーションを得て、予測されたポーズを時間から切り離す意味的に意味のあるポーズ予測タスクを定義する。
特徴ポーズを予測するために,まず,特徴ポーズの分布の多相性をモデル化する確率論的手法を提案する。
その後、関節間の依存関係をモデル化するために、予測された分布から将来のポーズを自己回帰的に分析し、最終的に骨の長さと角度の制約で結果のポーズを最適化する。
本手法を評価するために,手作業による特徴的3dポーズのデータセットを構築した。
このデータセットを用いた実験は,提案手法が平均22%の精度で最先端手法を上回っていることを示唆する。
関連論文リスト
- TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting [27.3359362364858]
本稿では,頑健な時間的表現を学習する効率的な多視点ポーズ推定モデルを提案する。
我々のモデルは微調整なしでデータセットをまたいで一般化することができる。
論文 参考訳(メタデータ) (2023-09-14T17:56:30Z) - Self-supervised 3D Human Pose Estimation from a Single Image [1.0878040851638]
本研究では,1枚の画像から3次元人体ポーズを予測する自己教師型手法を提案する。
予測ネットワークは、典型的なポーズの人物と、未ペアの2Dポーズのセットを描写した未ラベル画像のデータセットから訓練される。
論文 参考訳(メタデータ) (2023-04-05T10:26:21Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Live Stream Temporally Embedded 3D Human Body Pose and Shape Estimation [13.40702053084305]
ライブストリーム映像の精度と時間的整合性を改善するために,時間的に埋め込まれた3次元人体ポーズと形状推定法(TePose)を提案する。
マルチスケールの畳み込みネットワークを,3次元ラベリングを伴わないデータセットを用いた対人訓練のための運動判別器として提示する。
論文 参考訳(メタデータ) (2022-07-25T21:21:59Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Self-Attentive 3D Human Pose and Shape Estimation from Videos [82.63503361008607]
3D人間のポーズと形状推定のためのビデオベースの学習アルゴリズムを紹介します。
ビデオの時間情報を利用して自己着脱モジュールを提案する。
本手法を3DPW, MPI-INF-3DHP, Human3.6Mデータセット上で評価した。
論文 参考訳(メタデータ) (2021-03-26T00:02:19Z) - Long Term Motion Prediction Using Keyposes [122.22758311506588]
長期的な予測を達成するには、瞬時に人間のポーズを予測する必要があると論じている。
このようなポーズを「キーポス」と呼び、後続のキーポスを線形に補間して近似する複素運動と呼ぶ。
このようなキープレースのシーケンスを学習することで,将来的には最大5秒まで,非常に長期にわたる動作を予測できることが示される。
論文 参考訳(メタデータ) (2020-12-08T20:45:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。