論文の概要: Occlusion Robust 3D Human Pose Estimation with StridedPoseGraphFormer
and Data Augmentation
- arxiv url: http://arxiv.org/abs/2304.12069v1
- Date: Mon, 24 Apr 2023 13:05:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 14:53:31.545874
- Title: Occlusion Robust 3D Human Pose Estimation with StridedPoseGraphFormer
and Data Augmentation
- Title(参考訳): StridedPoseGraphFormerによる咬合ロバスト3次元人物位置推定とデータ拡張
- Authors: Soubarna Banik, Patricia Gscho{\ss}mann, Alejandro Mendoza Garcia,
Alois Knoll
- Abstract要約: 提案手法は最先端技術(SoA)と良好に比較できることを示す。
また, 閉塞処理機構が存在しない場合には, SoA 3D HPE法の性能が著しく低下することが明らかとなった。
- 参考スコア(独自算出の注目度): 69.49430149980789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Occlusion is an omnipresent challenge in 3D human pose estimation (HPE). In
spite of the large amount of research dedicated to 3D HPE, only a limited
number of studies address the problem of occlusion explicitly. To fill this
gap, we propose to combine exploitation of spatio-temporal features with
synthetic occlusion augmentation during training to deal with occlusion. To
this end, we build a spatio-temporal 3D HPE model, StridedPoseGraphFormer based
on graph convolution and transformers, and train it using occlusion
augmentation. Unlike the existing occlusion-aware methods, that are only tested
for limited occlusion, we extensively evaluate our method for varying degrees
of occlusion. We show that our proposed method compares favorably with the
state-of-the-art (SoA). Our experimental results also reveal that in the
absence of any occlusion handling mechanism, the performance of SoA 3D HPE
methods degrades significantly when they encounter occlusion.
- Abstract(参考訳): 咬合は3次元ポーズ推定(hpe)における全能的課題である。
3D HPEを専門とする多くの研究にもかかわらず、排他的排他的問題に対処する研究は限られている。
このギャップを埋めるために, 咬合処理における時空間的特徴の活用と合成咬合増強を組み合わせることを提案する。
この目的のために,グラフ畳み込みとトランスフォーマーに基づく時空間3次元HPEモデルStridedPoseGraphFormerを構築し,オクルージョン拡張を用いて学習する。
限定閉塞試験のみを行う既存の閉塞認識法と異なり, 閉塞度の変化について広範囲に評価した。
本稿では,提案手法を最先端技術(SoA)と比較する。
また, 閉塞処理機構が存在しない場合には, SoA 3D HPE法の性能が著しく低下することが明らかとなった。
関連論文リスト
- Enhancing 3D Human Pose Estimation Amidst Severe Occlusion with Dual Transformer Fusion [13.938406073551844]
本稿では,DTF(Dual Transformer Fusion)アルゴリズムを提案する。
正確な3Dヒューマンポース推定を実現するために,本手法では,まず2つの中間ビューを生成する革新的なDTFアーキテクチャを利用する。
このアプローチは、両方のデータセットで既存の最先端メソッドよりも優れており、大幅に改善されています。
論文 参考訳(メタデータ) (2024-10-06T18:15:27Z) - 3D Human Pose Estimation with Occlusions: Introducing BlendMimic3D Dataset and GCN Refinement [6.858859328420893]
この研究は、HPE(3D Human Pose Estimation)における最先端のギャップを特定し、対処する。
BlendMimic3Dデータセットは,オクルージョンが発生している現実世界の状況を模倣するように設計されている。
また,グラフモデルによるポーズ表現を強化するために,GCN(Graph Convolutional Network)を用いた3次元ポーズ改善ブロックを提案する。
論文 参考訳(メタデータ) (2024-04-24T18:49:37Z) - OccGaussian: 3D Gaussian Splatting for Occluded Human Rendering [55.50438181721271]
表面レンダリングにNeRFを用いた従来手法では,閉鎖領域の復元には1日以上,閉塞領域のレンダリングには数秒を要していた。
OccGaussianは3D Gaussian Splattingをベースとして6分以内でトレーニングが可能で,最大160FPSまでの高品質な人体レンダリングを実現する。
論文 参考訳(メタデータ) (2024-04-12T13:00:06Z) - Occlusion Resilient 3D Human Pose Estimation [52.49366182230432]
排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つとして残されている。
単一カメラシーケンスからポーズを推測する最先端技術と比較して,このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-16T19:29:43Z) - 3D Textured Shape Recovery with Learned Geometric Priors [58.27543892680264]
本技術報告では,学習した幾何学的先入観を取り入れて,限界に対処するアプローチを提案する。
我々は、学習したポーズ予測からSMPLモデルを生成し、それを部分的な入力に融合させ、人体の事前知識を追加する。
また、異なるレベルのスケールを扱うために、新しい完全性を考慮したバウンディングボックス適応を提案する。
論文 参考訳(メタデータ) (2022-09-07T16:03:35Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Quantification of Occlusion Handling Capability of a 3D Human Pose
Estimation Framework [11.509692423756448]
提案手法は,関節の欠如を入力とした2次元骨格を用いて,より正確な3次元ポーズを推定する。
本実験は, 欠損関節に対する枠組みの有効性を実証するものである。
論文 参考訳(メタデータ) (2022-03-08T14:35:46Z) - 3D Pose Detection in Videos: Focusing on Occlusion [0.4588028371034406]
我々は,映像中の隠蔽型3Dポーズ検出のための既存の手法を構築した。
我々は,2次元ポーズ予測を生成するために,積み重ねられた時間ガラスネットワークからなる2段階アーキテクチャを実装した。
閉鎖関節によるポーズの予測を容易にするため,シリンダーマンモデルの直感的な一般化を導入する。
論文 参考訳(メタデータ) (2020-06-24T07:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。