論文の概要: Occlusion Robust 3D Human Pose Estimation with StridedPoseGraphFormer
and Data Augmentation
- arxiv url: http://arxiv.org/abs/2304.12069v1
- Date: Mon, 24 Apr 2023 13:05:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 14:53:31.545874
- Title: Occlusion Robust 3D Human Pose Estimation with StridedPoseGraphFormer
and Data Augmentation
- Title(参考訳): StridedPoseGraphFormerによる咬合ロバスト3次元人物位置推定とデータ拡張
- Authors: Soubarna Banik, Patricia Gscho{\ss}mann, Alejandro Mendoza Garcia,
Alois Knoll
- Abstract要約: 提案手法は最先端技術(SoA)と良好に比較できることを示す。
また, 閉塞処理機構が存在しない場合には, SoA 3D HPE法の性能が著しく低下することが明らかとなった。
- 参考スコア(独自算出の注目度): 69.49430149980789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Occlusion is an omnipresent challenge in 3D human pose estimation (HPE). In
spite of the large amount of research dedicated to 3D HPE, only a limited
number of studies address the problem of occlusion explicitly. To fill this
gap, we propose to combine exploitation of spatio-temporal features with
synthetic occlusion augmentation during training to deal with occlusion. To
this end, we build a spatio-temporal 3D HPE model, StridedPoseGraphFormer based
on graph convolution and transformers, and train it using occlusion
augmentation. Unlike the existing occlusion-aware methods, that are only tested
for limited occlusion, we extensively evaluate our method for varying degrees
of occlusion. We show that our proposed method compares favorably with the
state-of-the-art (SoA). Our experimental results also reveal that in the
absence of any occlusion handling mechanism, the performance of SoA 3D HPE
methods degrades significantly when they encounter occlusion.
- Abstract(参考訳): 咬合は3次元ポーズ推定(hpe)における全能的課題である。
3D HPEを専門とする多くの研究にもかかわらず、排他的排他的問題に対処する研究は限られている。
このギャップを埋めるために, 咬合処理における時空間的特徴の活用と合成咬合増強を組み合わせることを提案する。
この目的のために,グラフ畳み込みとトランスフォーマーに基づく時空間3次元HPEモデルStridedPoseGraphFormerを構築し,オクルージョン拡張を用いて学習する。
限定閉塞試験のみを行う既存の閉塞認識法と異なり, 閉塞度の変化について広範囲に評価した。
本稿では,提案手法を最先端技術(SoA)と比較する。
また, 閉塞処理機構が存在しない場合には, SoA 3D HPE法の性能が著しく低下することが明らかとなった。
関連論文リスト
- Occlusion Resilient 3D Human Pose Estimation [52.49366182230432]
排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つとして残されている。
単一カメラシーケンスからポーズを推測する最先端技術と比較して,このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-16T19:29:43Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - 3D Textured Shape Recovery with Learned Geometric Priors [58.27543892680264]
本技術報告では,学習した幾何学的先入観を取り入れて,限界に対処するアプローチを提案する。
我々は、学習したポーズ予測からSMPLモデルを生成し、それを部分的な入力に融合させ、人体の事前知識を追加する。
また、異なるレベルのスケールを扱うために、新しい完全性を考慮したバウンディングボックス適応を提案する。
論文 参考訳(メタデータ) (2022-09-07T16:03:35Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - OcclusionFusion: Occlusion-aware Motion Estimation for Real-time Dynamic
3D Reconstruction [14.130915525776055]
RGBDに基づくリアルタイム動的3次元再構成は、フレーム間運動推定の不正確さに悩まされる。
オクルージョンフュージョン(OcclusionFusion, OcclusionFusion)は、オクルージョンを意識した3次元運動を計算し、再構成を誘導する手法である。
本手法は,既存の単一ビューベースリアルタイム手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-03-15T15:09:01Z) - Quantification of Occlusion Handling Capability of a 3D Human Pose
Estimation Framework [11.509692423756448]
提案手法は,関節の欠如を入力とした2次元骨格を用いて,より正確な3次元ポーズを推定する。
本実験は, 欠損関節に対する枠組みの有効性を実証するものである。
論文 参考訳(メタデータ) (2022-03-08T14:35:46Z) - 3D Pose Detection in Videos: Focusing on Occlusion [0.4588028371034406]
我々は,映像中の隠蔽型3Dポーズ検出のための既存の手法を構築した。
我々は,2次元ポーズ予測を生成するために,積み重ねられた時間ガラスネットワークからなる2段階アーキテクチャを実装した。
閉鎖関節によるポーズの予測を容易にするため,シリンダーマンモデルの直感的な一般化を導入する。
論文 参考訳(メタデータ) (2020-06-24T07:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。