論文の概要: Back to MLP: A Simple Baseline for Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2207.01567v1
- Date: Mon, 4 Jul 2022 16:35:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 13:22:59.419521
- Title: Back to MLP: A Simple Baseline for Human Motion Prediction
- Title(参考訳): Back to MLP:人間の動作予測のためのシンプルなベースライン
- Authors: Wen Guo, Yuming Du, Xi Shen, Vincent Lepetit, Xavier Alameda-Pineda,
Francesc Moreno-Noguer
- Abstract要約: 本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
- 参考スコア(独自算出の注目度): 59.18776744541904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper tackles the problem of human motion prediction, consisting in
forecasting future body poses from historically observed sequences. Despite of
their performance, current state-of-the-art approaches rely on deep learning
architectures of arbitrary complexity, such as Recurrent Neural Networks~(RNN),
Transformers or Graph Convolutional Networks~(GCN), typically requiring
multiple training stages and more than 3 million of parameters. In this paper
we show that the performance of these approaches can be surpassed by a
light-weight and purely MLP architecture with only 0.14M parameters when
appropriately combined with several standard practices such as representing the
body pose with Discrete Cosine Transform (DCT), predicting residual
displacement of joints and optimizing velocity as an auxiliary loss.
An exhaustive evaluation on Human3.6M, AMASS and 3DPW datasets shows that our
method, which we dub siMLPe, consistently outperforms all other approaches. We
hope that our simple method could serve a strong baseline to the community and
allow re-thinking the problem of human motion prediction and whether current
benchmarks do really need intricate architectural designs. Our code is
available at \url{https://github.com/dulucas/siMLPe}.
- Abstract(参考訳): 本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる人間の動作予測の問題に取り組む。
そのパフォーマンスにもかかわらず、現在の最先端のアプローチは、リカレントニューラルネットワーク~(RNN)、トランスフォーマーやグラフ畳み込みネットワーク~(GCN)といった、任意の複雑性を持つディープラーニングアーキテクチャに依存しており、通常は複数のトレーニングステージと300万以上のパラメータを必要とする。
本稿では,DCT(Discrete Cosine Transform)による身体ポーズの表現,関節の残留変位の予測,補助的損失としての速度の最適化など,いくつかの標準手法と適切に組み合わせた場合,これらの手法の性能は軽量かつ純粋に0.14Mパラメータで達成可能であることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
我々の単純な手法がコミュニティの強力なベースラインとなり、人間の動作予測の問題を再考し、現在のベンチマークに複雑なアーキテクチャ設計が必要かどうかを期待する。
私たちのコードは \url{https://github.com/dulucas/siMLPe} で利用可能です。
関連論文リスト
- Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - A Lightweight Graph Transformer Network for Human Mesh Reconstruction
from 2D Human Pose [8.816462200869445]
GTRSは2次元の人間のポーズから人間のメッシュを再構築する。
我々は、Human3.6Mと3DPWデータセットの広範囲な評価により、GTRSの効率性と一般化を実証する。
論文 参考訳(メタデータ) (2021-11-24T18:48:03Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Bilevel Online Adaptation for Out-of-Domain Human Mesh Reconstruction [94.25865526414717]
本稿では,事前に訓練されたヒトメッシュ再構築モデルをドメイン外ストリーミングビデオに適応させるという新たな問題を検討する。
重みプローブと重み更新の2つのステップに全体多対象の最適化プロセスを分割するBilevel Online Adaptationを提案します。
BOAが2つのヒューマンメッシュ再構築ベンチマークで最先端の結果をもたらすことを実証する。
論文 参考訳(メタデータ) (2021-03-30T15:47:58Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - Hierarchical Kinematic Human Mesh Recovery [30.348060841242628]
一つの画像から3次元メッシュのパラメトリックモデルを推定する問題を考察する。
本稿では,ヒトのパラメトリックモデルの回帰に関する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T16:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。