論文の概要: Optimising 2D Pose Representation: Improve Accuracy, Stability and
Generalisability Within Unsupervised 2D-3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2209.00618v1
- Date: Thu, 1 Sep 2022 17:32:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 14:03:25.984545
- Title: Optimising 2D Pose Representation: Improve Accuracy, Stability and
Generalisability Within Unsupervised 2D-3D Human Pose Estimation
- Title(参考訳): 2次元ポーズ表現の最適化:教師なし2次元ポーズ推定における精度,安定性,汎用性の向上
- Authors: Peter Hardy, Srinandan Dasmahapatra, Hansung Kim
- Abstract要約: 2次元ポーズの最も最適な表現は2つの独立した部分(胴体と脚)であり、各リフトネットワーク間に共通な特徴はない。
その結果、2次元ポーズの最も最適な表現は2つの独立した部分(胴体と脚)であり、各リフトネットワーク間に共通な特徴はないことがわかった。
- 参考スコア(独自算出の注目度): 7.294965109944706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the problem of 2D pose representation during
unsupervised 2D to 3D pose lifting to improve the accuracy, stability and
generalisability of 3D human pose estimation (HPE) models. All unsupervised
2D-3D HPE approaches provide the entire 2D kinematic skeleton to a model during
training. We argue that this is sub-optimal and disruptive as long-range
correlations are induced between independent 2D key points and predicted 3D
ordinates during training. To this end, we conduct the following study. With a
maximum architecture capacity of 6 residual blocks, we evaluate the performance
of 5 models which each represent a 2D pose differently during the adversarial
unsupervised 2D-3D HPE process. Additionally, we show the correlations between
2D key points which are learned during the training process, highlighting the
unintuitive correlations induced when an entire 2D pose is provided to a
lifting model. Our results show that the most optimal representation of a 2D
pose is that of two independent segments, the torso and legs, with no shared
features between each lifting network. This approach decreased the average
error by 20\% on the Human3.6M dataset when compared to a model with a near
identical parameter count trained on the entire 2D kinematic skeleton.
Furthermore, due to the complex nature of adversarial learning, we show how
this representation can also improve convergence during training allowing for
an optimum result to be obtained more often.
- Abstract(参考訳): 本稿では,3次元ポーズ推定モデルの精度,安定性,一般化性を向上させるために,教師なし2次元ポーズリフト中の2次元ポーズ表現の問題に対処する。
教師なし2D-3D HPEアプローチはすべて、トレーニング中にモデルに2Dキネマティックスケルトン全体を提供する。
訓練中に独立した2dキーポイントと予測された3dオーディネートの間で長距離相関が引き起こされるため、これは最適かつ破壊的である。
この目的のために、以下の研究を行う。
アーキテクチャの最大容量は6ブロックであり, 2D-3D HPEプロセスにおいて, それぞれ異なる2Dポーズを示す5つのモデルの性能を評価する。
さらに,トレーニングプロセス中に学習した2Dキーポイント間の相関関係を示し,揚力モデルに2Dポーズ全体を提供する際に生じる直感的相関関係を明らかにする。
その結果、2次元ポーズの最も最適な表現は2つの独立した部分(胴体と脚)であり、各リフトネットワーク間に共通な特徴はないことがわかった。
このアプローチにより、Human3.6Mデータセットの平均誤差は、2Dキネマティックスケルトン全体でトレーニングされたほぼ同一のパラメータ数を持つモデルと比較すると、20\%減少した。
さらに, 対人学習の複雑な性質から, この表現が学習中の収束を向上し, 最適結果がより頻繁に得られることを示す。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - LInKs "Lifting Independent Keypoints" -- Partial Pose Lifting for
Occlusion Handling with Improved Accuracy in 2D-3D Human Pose Estimation [4.648549457266638]
2Dキネマティックスケルトンから3D人間のポーズを復元する新しい教師なし学習法であるLInKsを提案する。
提案手法は,まず3次元領域に隠された2次元のポーズを持ち上げるという,ユニークな2段階のプロセスに従う。
このリフト・テン・フィルのアプローチは、2次元空間でのみポーズを完了したモデルよりもはるかに正確な結果をもたらす。
論文 参考訳(メタデータ) (2023-09-13T18:28:04Z) - "Teaching Independent Parts Separately"(TIPSy-GAN) : Improving Accuracy
and Stability in Unsupervised Adversarial 2D to 3D Human Pose Estimation [7.294965109944706]
教師なし対人2次元から3次元のポーズ推定における精度と安定性を改善するための新しいアプローチであるTIPSy-GANを提案する。
我々の研究では、ヒトのキネマティック骨格は1つの空間的相互依存構造として想定されるべきでないことを示した。
論文 参考訳(メタデータ) (2022-05-12T09:40:25Z) - PoseTriplet: Co-evolving 3D Human Pose Estimation, Imitation, and
Hallucination under Self-supervision [102.48681650013698]
既存の自己監督型3次元ポーズ推定スキームは、学習を導くための弱い監督に大きく依存している。
そこで我々は,2D-3Dのポーズペアを明示的に生成し,監督を増強する,新しい自己監督手法を提案する。
これは、ポーズ推定器とポーズ幻覚器を併用して学習する強化学習ベースの模倣器を導入することで可能となる。
論文 参考訳(メタデータ) (2022-03-29T14:45:53Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z) - View-Invariant, Occlusion-Robust Probabilistic Embedding for Human Pose [36.384824115033304]
本研究では,3次元のポーズを明示的に予測することなく,2次元のボディジョイントキーポイントからコンパクトなビュー不変埋め込み空間を学習する手法を提案する。
実験の結果,異なるカメラビューで類似のポーズを検索すると,埋め込みモデルの精度が向上することがわかった。
論文 参考訳(メタデータ) (2020-10-23T17:58:35Z) - Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage
Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。
既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。
頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-13T15:24:28Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Learning 2D-3D Correspondences To Solve The Blind Perspective-n-Point
Problem [98.92148855291363]
本稿では、6-DoFの絶対カメラポーズ2D--3D対応を同時に解決するディープCNNモデルを提案する。
実データとシミュレーションデータの両方でテストした結果,本手法は既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-03-15T04:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。