論文の概要: Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D
Pose Data
- arxiv url: http://arxiv.org/abs/2105.10837v1
- Date: Sun, 23 May 2021 01:20:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:16:04.305134
- Title: Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D
Pose Data
- Title(参考訳): 適応型人間詩:ゼロリアル3次元データを用いた単眼的人間詩推定
- Authors: Shuangjun Liu, Naveen Sehgal, Sarah Ostadabbas
- Abstract要約: トレーニングとテストデータドメインのギャップは、しばしばモデルのパフォーマンスに悪影響を及ぼします。
本稿では、外見とポーズ空間の両方における適応問題に対処する適応的ヒューマンポーズ(AHuP)アプローチを提案する。
AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
- 参考スコア(独自算出の注目度): 14.719976311208502
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ultimate goal for an inference model is to be robust and functional in
real life applications. However, training vs. test data domain gaps often
negatively affect model performance. This issue is especially critical for the
monocular 3D human pose estimation problem, in which 3D human data is often
collected in a controlled lab setting. In this paper, we focus on alleviating
the negative effect of domain shift by presenting our adapted human pose (AHuP)
approach that addresses adaptation problems in both appearance and pose spaces.
AHuP is built around a practical assumption that in real applications, data
from target domain could be inaccessible or only limited information can be
acquired. We illustrate the 3D pose estimation performance of AHuP in two
scenarios. First, when source and target data differ significantly in both
appearance and pose spaces, in which we learn from synthetic 3D human data
(with zero real 3D human data) and show comparable performance with the
state-of-the-art 3D pose estimation models that have full access to the real 3D
human pose benchmarks for training. Second, when source and target datasets
differ mainly in the pose space, in which AHuP approach can be applied to
further improve the performance of the state-of-the-art models when tested on
the datasets different from their training dataset.
- Abstract(参考訳): 推論モデルの最終的な目標は、実生活のアプリケーションで堅牢で機能することである。
しかし、トレーニングとテストデータドメインのギャップはしばしばモデルの性能に悪影響を及ぼします。
この問題は、制御された実験室でしばしば3次元の人間のデータが収集される単眼的3次元人物ポーズ推定問題において特に重要である。
本稿では,出現空間とポーズ空間の両方における適応問題に対処するhup(adapted human pose)アプローチを提案することで,ドメインシフトの悪影響を緩和することに焦点を当てる。
AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
AHuPの3次元ポーズ推定性能を2つのシナリオで説明する。
まず、ソースとターゲットのデータが外観とポーズ空間の両方で著しく異なる場合、合成された3d人間データ(実際の3d人間データはゼロ)から学び、トレーニングのために実際の3d人間ポーズベンチマークに完全にアクセスできる最先端の3dポーズ推定モデルと同等のパフォーマンスを示す。
第二に、ソースとターゲットのデータセットが主にポーズ空間で異なる場合、トレーニングデータセットとは異なるデータセットでテストした場合の最先端モデルのパフォーマンスをさらに向上するためにAHuPアプローチを適用することができる。
関連論文リスト
- StackFLOW: Monocular Human-Object Reconstruction by Stacked Normalizing Flow with Offset [56.71580976007712]
本研究では,人間のメッシュと物体メッシュの表面から密にサンプリングされたアンカー間の人物体オフセットを用いて,人物体空間関係を表現することを提案する。
この表現に基づいて、画像から人・物間の空間関係の後方分布を推定するスタック正規化フロー(StackFLOW)を提案する。
最適化段階では、サンプルの可能性を最大化することにより、人体ポーズと物体6Dポーズを微調整する。
論文 参考訳(メタデータ) (2024-07-30T04:57:21Z) - ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Heuristic Weakly Supervised 3D Human Pose Estimation [13.82540778667711]
弱教師付き3D人間のポーズ(HW-HuP)ソリューションは、3Dのポーズデータが入手できない場合に3Dのポーズを推定する。
HW-HuPは,ヒトのベッドでのポーズと野生での幼児のポーズという,3次元のポーズデータが得られにくい2つの実践的な環境で,最先端のモデルにおいて有意義に改善されていることを示す。
論文 参考訳(メタデータ) (2021-05-23T18:40:29Z) - Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage
Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。
既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。
頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-13T15:24:28Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Measuring Generalisation to Unseen Viewpoints, Articulations, Shapes and
Objects for 3D Hand Pose Estimation under Hand-Object Interaction [137.28465645405655]
HANDS'19は、現在の3Dハンドポーズ推定器(HPE)がトレーニングセットのポーズを補間し、外挿する能力を評価するための課題である。
本研究では,最先端手法の精度が低下し,トレーニングセットから外れたポーズでほとんど失敗することを示す。
論文 参考訳(メタデータ) (2020-03-30T19:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。