論文の概要: Benchmarking and Analyzing 3D Human Pose and Shape Estimation Beyond
Algorithms
- arxiv url: http://arxiv.org/abs/2209.10529v1
- Date: Wed, 21 Sep 2022 17:39:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 16:44:32.447040
- Title: Benchmarking and Analyzing 3D Human Pose and Shape Estimation Beyond
Algorithms
- Title(参考訳): アルゴリズムを越えた3次元人文と形状推定のベンチマークと解析
- Authors: Hui En Pang, Zhongang Cai, Lei Yang, Tianwei Zhang and Ziwei Liu
- Abstract要約: この研究は、アルゴリズム以外の3つの未探索視点からの最初の総合的なベンチマーク研究を示す。
31のデータセットの分析では、データサンプルの異なる影響が明らかになっている。
比較的単純なモデルで3DPWテストセットで47.3mmのPA-MPJPEを実現する。
- 参考スコア(独自算出の注目度): 31.2529724533643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D human pose and shape estimation (a.k.a. "human mesh recovery") has
achieved substantial progress. Researchers mainly focus on the development of
novel algorithms, while less attention has been paid to other critical factors
involved. This could lead to less optimal baselines, hindering the fair and
faithful evaluations of newly designed methodologies. To address this problem,
this work presents the first comprehensive benchmarking study from three
under-explored perspectives beyond algorithms. 1) Datasets. An analysis on 31
datasets reveals the distinct impacts of data samples: datasets featuring
critical attributes (i.e. diverse poses, shapes, camera characteristics,
backbone features) are more effective. Strategical selection and combination of
high-quality datasets can yield a significant boost to the model performance.
2) Backbones. Experiments with 10 backbones, ranging from CNNs to transformers,
show the knowledge learnt from a proximity task is readily transferable to
human mesh recovery. 3) Training strategies. Proper augmentation techniques and
loss designs are crucial. With the above findings, we achieve a PA-MPJPE of
47.3 mm on the 3DPW test set with a relatively simple model. More importantly,
we provide strong baselines for fair comparisons of algorithms, and
recommendations for building effective training configurations in the future.
Codebase is available at http://github.com/smplbody/hmr-benchmarks
- Abstract(参考訳): 3次元の人間のポーズと形状の推定(すなわち「人間のメッシュ回復」)は大きな進歩を遂げた。
研究者は主に新しいアルゴリズムの開発に焦点を当てているが、他の重要な要因には注意が払われていない。
これにより、最適化基準が低くなり、新しく設計された方法論の公正で忠実な評価が妨げられる可能性がある。
この問題に対処するため,本研究では,アルゴリズム以外の3つの未熟な視点から,初めて包括的なベンチマーク研究を行う。
1)データセット。
重要な属性(多彩なポーズ、形状、カメラの特徴、バックボーンの特徴など)を特徴とするデータセットの方が効果的である。
高品質なデータセットの戦略的選択と組み合わせは、モデルパフォーマンスを著しく向上させる可能性がある。
2)バックボーン。
CNNからトランスフォーマーまで10のバックボーンを用いた実験は、近接タスクから学んだ知識が容易に人間のメッシュリカバリに転送可能であることを示している。
3)訓練戦略
適切な拡張技術と損失設計が不可欠である。
以上の結果から,比較的簡易なモデルで3DPWテストセットで47.3mmのPA-MPJPEを得ることができた。
さらに重要なことは、アルゴリズムの公正な比較のための強力なベースラインと、将来効果的なトレーニング構成を構築するための推奨を提供します。
Codebaseはhttp://github.com/smplbody/hmr-benchmarksで入手できる。
関連論文リスト
- The Trifecta: Three simple techniques for training deeper
Forward-Forward networks [0.0]
本稿では,より深いネットワーク上でのフォワード・フォワードアルゴリズムを大幅に改善する3つの手法のコレクションを提案する。
我々の実験は、我々のモデルが、単純なデータセットのトレーニング速度とテスト精度の両方において、同様に構造化されたバックプロパゲーションベースのモデルと同等であることを示した。
論文 参考訳(メタデータ) (2023-11-29T22:44:32Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - Towards Robust Dataset Learning [90.2590325441068]
本稿では,頑健なデータセット学習問題を定式化するための三段階最適化法を提案する。
ロバストな特徴と非ロバストな特徴を特徴付ける抽象モデルの下で,提案手法はロバストなデータセットを確実に学習する。
論文 参考訳(メタデータ) (2022-11-19T17:06:10Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Deep Optimized Priors for 3D Shape Modeling and Reconstruction [38.79018852887249]
3Dモデリングと再構築のための新しい学習フレームワークを紹介します。
提案手法は,事前訓練によって制約された障壁を効果的に破壊することを示す。
論文 参考訳(メタデータ) (2020-12-14T03:56:31Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。