論文の概要: Pose-Oriented Transformer with Uncertainty-Guided Refinement for
2D-to-3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2302.07408v1
- Date: Wed, 15 Feb 2023 00:22:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-16 16:11:00.477142
- Title: Pose-Oriented Transformer with Uncertainty-Guided Refinement for
2D-to-3D Human Pose Estimation
- Title(参考訳): 2次元から3次元の人物位置推定のための不確かさ誘導型変圧器
- Authors: Han Li, Bowen Shi, Wenrui Dai, Hongwei Zheng, Botao Wang, Yu Sun, Min
Guo, Chenlin Li, Junni Zou, Hongkai Xiong
- Abstract要約: 本研究では,3次元ポーズ推定のための不確実性ガイド付き多目的変換器(POT)を提案する。
我々はまず,人骨のトポロジーを明示的に活用するために,新しいポーズ指向の自己注意機構と距離関連位置埋め込みを開発した。
本稿では,特に難解な関節に対するPOTからのポーズ予測を洗練させるために,不確実性誘導型リファインメントネットワーク(UGRN)を提案する。
- 参考スコア(独自算出の注目度): 51.00725889172323
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: There has been a recent surge of interest in introducing transformers to 3D
human pose estimation (HPE) due to their powerful capabilities in modeling
long-term dependencies. However, existing transformer-based methods treat body
joints as equally important inputs and ignore the prior knowledge of human
skeleton topology in the self-attention mechanism. To tackle this issue, in
this paper, we propose a Pose-Oriented Transformer (POT) with uncertainty
guided refinement for 3D HPE. Specifically, we first develop novel
pose-oriented self-attention mechanism and distance-related position embedding
for POT to explicitly exploit the human skeleton topology. The pose-oriented
self-attention mechanism explicitly models the topological interactions between
body joints, whereas the distance-related position embedding encodes the
distance of joints to the root joint to distinguish groups of joints with
different difficulties in regression. Furthermore, we present an
Uncertainty-Guided Refinement Network (UGRN) to refine pose predictions from
POT, especially for the difficult joints, by considering the estimated
uncertainty of each joint with uncertainty-guided sampling strategy and
self-attention mechanism. Extensive experiments demonstrate that our method
significantly outperforms the state-of-the-art methods with reduced model
parameters on 3D HPE benchmarks such as Human3.6M and MPI-INF-3DHP
- Abstract(参考訳): 近年,長期的依存関係をモデル化する上で強力な能力を持つ3次元ポーズ推定(HPE)へのトランスフォーマー導入への関心が高まっている。
しかし、既存のトランスフォーマーベースの手法では、身体関節を等しく重要な入力として扱い、自己着脱機構におけるヒト骨格トポロジーの事前知識を無視している。
この問題に対処するために,我々は3次元HPEのための不確かさをガイドしたPOT(Pose-Oriented Transformer)を提案する。
具体的には,人間骨格トポロジーを明示的に活用するために,ポットの姿勢指向セルフアテンション機構と距離関連位置埋め込み機構を初めて開発した。
ポーズ指向の自己アテンション機構は、明確に身体関節間のトポロジカルな相互作用をモデル化する一方、距離に関連した位置埋め込みは、歯根関節との距離をエンコードし、異なる回帰困難を有する関節群を識別する。
さらに, 不確実性誘導型サンプリング戦略と自己保持機構による各関節の不確かさを考慮し,POTからのポーズ予測を洗練するための不確実性誘導型リファインメントネットワーク(UGRN)を提案する。
この手法はHuman3.6MやMPI-INF-3DHPといった3次元HPEベンチマークにおいて,モデルパラメータの削減による最先端の手法よりも優れていた。
関連論文リスト
- ManiPose: Manifold-Constrained Multi-Hypothesis 3D Human Pose Estimation [54.86887812687023]
ほとんどの3D-HPE法は回帰モデルに依存しており、入力と出力の1対1のマッピングを前提としている。
提案するManiPoseは,2次元入力毎に複数の候補3次元ポーズを提案可能な,新しい多様体制約型マルチハイポテーシスモデルである。
従来のマルチハイブリッドアプローチとは異なり、我々のソリューションは完全に教師付きであり、複雑な生成モデルに依存しない。
論文 参考訳(メタデータ) (2023-12-11T13:50:10Z) - (Fusionformer):Exploiting the Joint Motion Synergy with Fusion Network
Based On Transformer for 3D Human Pose Estimation [1.52292571922932]
多くの従来手法では、局所的な関節情報の理解が欠けていた。
提案手法では,グローバル・テンポラル・セルフ・トラジェクトリ・モジュールとクロス・テンポラル・セルフ・トラジェクトリ・モジュールを導入する。
その結果、Human3.6Mデータセットでは2.4%のMPJPEと4.3%のP-MPJPEが改善された。
論文 参考訳(メタデータ) (2022-10-08T12:22:10Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Higher-Order Implicit Fairing Networks for 3D Human Pose Estimation [1.1501261942096426]
2次元から3次元のポーズ推定のための初期残差接続を持つ高階グラフ畳み込みフレームワークを提案する。
我々のモデルは、体節間の長距離依存関係を捉えることができる。
2つの標準ベンチマークで行った実験と改善研究は、我々のモデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-11-01T13:48:55Z) - THUNDR: Transformer-based 3D HUmaN Reconstruction with Markers [67.8628917474705]
THUNDRは、人の3Dポーズと形状を再構築するトランスフォーマーベースのディープニューラルネットワーク手法である。
完全教師付きモデルと自己教師型モデルの両方に対して,Human3.6Mと3DPWの最先端結果を示す。
野生で収集された難易度の高い人間のポーズに対して, 非常に堅固な3次元再構成性能を観察した。
論文 参考訳(メタデータ) (2021-06-17T09:09:24Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。