論文の概要: A generic diffusion-based approach for 3D human pose prediction in the
wild
- arxiv url: http://arxiv.org/abs/2210.05669v1
- Date: Tue, 11 Oct 2022 17:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 17:48:40.831728
- Title: A generic diffusion-based approach for 3D human pose prediction in the
wild
- Title(参考訳): 野生動物における3次元ポーズ予測のための汎用拡散に基づくアプローチ
- Authors: Saeed Saadatnejad, Ali Rasekh, Mohammadreza Mofayezi, Yasamin
Medghalchi, Sara Rajabzadeh, Taylor Mordan, Alexandre Alahi
- Abstract要約: 3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
- 参考スコア(独自算出の注目度): 68.00961210467479
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D human pose forecasting, i.e., predicting a sequence of future human 3D
poses given a sequence of past observed ones, is a challenging spatio-temporal
task. It can be more challenging in real-world applications where occlusions
will inevitably happen, and estimated 3D coordinates of joints would contain
some noise. We provide a unified formulation in which incomplete elements (no
matter in the prediction or observation) are treated as noise and propose a
conditional diffusion model that denoises them and forecasts plausible poses.
Instead of naively predicting all future frames at once, our model consists of
two cascaded sub-models, each specialized for modeling short and long horizon
distributions. We also propose a generic framework to improve any 3D pose
forecasting model by leveraging our diffusion model in two additional steps: a
pre-processing step to repair the inputs and a post-processing step to refine
the outputs. We investigate our findings on four standard datasets (Human3.6M,
HumanEva-I, AMASS, and 3DPW) and obtain significant improvements over the
state-of-the-art. The code will be made available online.
- Abstract(参考訳): 3d人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスを与えられた将来の人間の3dポーズのシーケンスを予測することは、時空間的課題である。
咬合が必然的に起こり、関節の3d座標が何らかのノイズを含む現実世界のアプリケーションでは、より困難になる可能性がある。
不完全な要素(予測や観測にかかわらず)がノイズとして扱われる統一的な定式化と、それらを記述し、妥当なポーズを予測できる条件拡散モデルを提案する。
我々のモデルは、全ての将来のフレームを一斉に予測する代わりに、2つのカスケードされたサブモデルで構成され、それぞれが短くて長い水平分布をモデル化する。
また,入力を修復する前処理ステップと出力を洗練する後処理ステップという2つのステップで拡散モデルを活用し,任意の3次元ポーズ予測モデルを改善する汎用フレームワークを提案する。
我々は,4つの標準データセット(Human3.6M,HumanEva-I,AMASS,3DPW)について検討し,現状よりも大幅に改善した。
コードはオンラインで公開されます。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - DiffHPE: Robust, Coherent 3D Human Pose Lifting with Diffusion [54.0238087499699]
拡散モデルにより,人間のポーズ推定精度,ロバスト性,コヒーレンス性が向上することを示す。
3D-HPEにおける拡散モデルを利用する新しい戦略であるDiffHPEを紹介する。
以上の結果から, 独立拡散モデルにより, 予測可能な性能が得られる一方で, 教師付きモデルと組み合わせて精度が向上することが示唆された。
論文 参考訳(メタデータ) (2023-09-04T12:54:10Z) - FutureHuman3D: Forecasting Complex Long-Term 3D Human Behavior from Video Observations [26.693664045454526]
本稿では,3次元における長期的人間の行動を予測するための生成的アプローチを提案する。
我々は高レベルの粗いアクションラベルと低レベルの微粒化を特徴的3次元人間のポーズとして共同で予測する。
実験では,関節動作と3次元ポーズ予測の相補的性質を実証した。
論文 参考訳(メタデータ) (2022-11-25T18:59:53Z) - Autoregressive Uncertainty Modeling for 3D Bounding Box Prediction [63.3021778885906]
3Dバウンディングボックスは、多くのコンピュータビジョンアプリケーションで広く使われている中間表現である。
本稿では,自己回帰モデルを利用して高い信頼度予測と意味のある不確実性対策を行う手法を提案する。
我々はシミュレーションデータセットであるCOB-3Dをリリースし、現実世界のロボティクスアプリケーションで発生する新しいタイプのあいまいさを強調します。
論文 参考訳(メタデータ) (2022-10-13T23:57:40Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Forecasting Characteristic 3D Poses of Human Actions [24.186058965796157]
本研究では,人物のモノクロ映像から特徴的3Dポーズを予測し,その人物の将来的な3Dポーズを,アクション定義可能な特徴的ポーズで予測するタスクを提案する。
我々は、目標指向行動からインスピレーションを得て、予測されたポーズを時間から切り離す意味論的に意味のあるポーズ予測タスクを定義する。
このデータセットを用いた実験により,提案手法は最先端手法を平均22%上回る確率的手法であることが示唆された。
論文 参考訳(メタデータ) (2020-11-30T18:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。