論文の概要: AdaptPose: Cross-Dataset Adaptation for 3D Human Pose Estimation by
Learnable Motion Generation
- arxiv url: http://arxiv.org/abs/2112.11593v1
- Date: Wed, 22 Dec 2021 00:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 23:07:25.707334
- Title: AdaptPose: Cross-Dataset Adaptation for 3D Human Pose Estimation by
Learnable Motion Generation
- Title(参考訳): AdaptPose:学習可能なモーション生成による3次元人物姿勢推定のためのクロスデータセット適応
- Authors: Mohsen Gholami, Bastian Wandt, Helge Rhodin, Rabab Ward, and Z. Jane
Wang
- Abstract要約: トレーニング済みの3Dポーズ推定器を新しいデータセットでテストすると、大きなパフォーマンス低下が発生する。
本稿では、ソースデータセットから合成された3次元人間の動きを生成するエンドツーエンドフレームワークであるAdaptPoseを提案する。
提案手法は, 部分的な3Dアノテーションを用いた半教師あり学習法を16%, クロスデータセット評価において14%, 従来の半教師あり学習法よりも16%優れていた。
- 参考スコア(独自算出の注目度): 24.009674750548303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the problem of cross-dataset generalization of 3D human
pose estimation models. Testing a pre-trained 3D pose estimator on a new
dataset results in a major performance drop. Previous methods have mainly
addressed this problem by improving the diversity of the training data. We
argue that diversity alone is not sufficient and that the characteristics of
the training data need to be adapted to those of the new dataset such as camera
viewpoint, position, human actions, and body size. To this end, we propose
AdaptPose, an end-to-end framework that generates synthetic 3D human motions
from a source dataset and uses them to fine-tune a 3D pose estimator. AdaptPose
follows an adversarial training scheme. From a source 3D pose the generator
generates a sequence of 3D poses and a camera orientation that is used to
project the generated poses to a novel view. Without any 3D labels or camera
information AdaptPose successfully learns to create synthetic 3D poses from the
target dataset while only being trained on 2D poses. In experiments on the
Human3.6M, MPI-INF-3DHP, 3DPW, and Ski-Pose datasets our method outperforms
previous work in cross-dataset evaluations by 14% and previous semi-supervised
learning methods that use partial 3D annotations by 16%.
- Abstract(参考訳): 本稿では,3次元ポーズ推定モデルのデータセット間一般化の問題に対処する。
トレーニング済みの3Dポーズ推定器を新しいデータセットでテストすると、大きなパフォーマンス低下が発生する。
従来はトレーニングデータの多様性を向上させることでこの問題に対処してきた。
我々は、多様性だけでは不十分であり、トレーニングデータの特徴は、カメラの視点、位置、人間の行動、体の大きさなどの新しいデータセットに適応する必要があると主張している。
この目的のために、ソースデータセットから合成された3D人間の動きを生成し、3Dポーズ推定器を微調整する、エンドツーエンドのフレームワークAdaptPoseを提案する。
AdaptPoseは敵のトレーニングスキームに従う。
ソース3Dポーズからジェネレータは、3Dポーズのシーケンスと、生成されたポーズを新しいビューに投影するために使用されるカメラ向きを生成する。
AdaptPoseは、ターゲットデータセットから合成された3Dポーズを作成するのに成功し、2Dポーズでのみ訓練される。
Human3.6M, MPI-INF-3DHP, 3DPW, Ski-Poseを用いた実験では, 部分的な3Dアノテーションを用いた従来の半教師あり学習手法よりも16%向上した。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - PoseGen: Learning to Generate 3D Human Pose Dataset with NeRF [20.841557239621995]
本稿では,Neural Radiance Fields (NeRF) を用いた3次元ポーズデータセット生成のためのエンドツーエンドフレームワークを提案する。
NeRFはデータ駆動型であり、人間の3Dスキャンを必要としない。そのため、データ生成にNeRFを用いることは、便利なユーザ固有のデータ生成のための新しい方向である。
論文 参考訳(メタデータ) (2023-12-22T18:50:15Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - ElePose: Unsupervised 3D Human Pose Estimation by Predicting Camera
Elevation and Learning Normalizing Flows on 2D Poses [23.554957518485324]
本研究では、1つの画像から3次元人間のポーズを予測することを学ぶ教師なしのアプローチを提案する。
ランダムなプロジェクションに最も近い3次元ポーズを推定し、2次元ポーズの正規化フローを用いて推定する。
我々は,Human3.6M と MPI-INF-3DHP のベンチマークデータセット上で,最先端の教師なしポーズ推定手法を多くの指標で上回っている。
論文 参考訳(メタデータ) (2021-12-14T01:12:45Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - TriPose: A Weakly-Supervised 3D Human Pose Estimation via Triangulation
from Video [23.00696619207748]
ビデオから3D人間のポーズを推定することは難しい問題です。
3Dヒューマンポーズアノテーションの欠如は、教師付きトレーニングと、見えないデータセットへの一般化の大きな障害です。
3dアノテーションやキャリブレーションカメラを必要としない弱い教師付きトレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-14T00:46:48Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Towards Generalization of 3D Human Pose Estimation In The Wild [73.19542580408971]
3DBodyTex.Poseは、3Dの人間のポーズ推定のタスクに対処するデータセットである。
3DBodyTex.Poseは、さまざまな衣服やポーズで405種類の実際の被写体を含む高品質でリッチなデータを提供する。
論文 参考訳(メタデータ) (2020-04-21T13:31:58Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D
Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。
既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。
結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文 参考訳(メタデータ) (2020-04-07T20:21:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。