論文の概要: Occlusion Resilient 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2402.11036v1
- Date: Fri, 16 Feb 2024 19:29:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 23:49:11.747597
- Title: Occlusion Resilient 3D Human Pose Estimation
- Title(参考訳): 咬合回復性3次元ポーズ推定
- Authors: Soumava Kumar Roy, Ilia Badanin, Sina Honari and Pascal Fua
- Abstract要約: 排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つとして残されている。
単一カメラシーケンスからポーズを推測する最先端技術と比較して,このアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 52.49366182230432
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Occlusions remain one of the key challenges in 3D body pose estimation from
single-camera video sequences. Temporal consistency has been extensively used
to mitigate their impact but the existing algorithms in the literature do not
explicitly model them.
Here, we apply this by representing the deforming body as a spatio-temporal
graph. We then introduce a refinement network that performs graph convolutions
over this graph to output 3D poses. To ensure robustness to occlusions, we
train this network with a set of binary masks that we use to disable some of
the edges as in drop-out techniques.
In effect, we simulate the fact that some joints can be hidden for periods of
time and train the network to be immune to that. We demonstrate the
effectiveness of this approach compared to state-of-the-art techniques that
infer poses from single-camera sequences.
- Abstract(参考訳): 排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つである。
時間的一貫性は影響を軽減するために広く使用されているが、文献の既存のアルゴリズムはそれらを明示的にモデル化していない。
ここでは、変形体を時空間グラフとして表現することでこれを適用する。
次に、このグラフ上でグラフ畳み込みを行い、3dポーズを出力するrefinement networkを導入する。
閉塞に対する堅牢性を確保するため、ドロップアウト手法のようにエッジの一部を無効にするために使用するバイナリマスクセットを用いてネットワークをトレーニングする。
実際、いくつかのジョイントを一定期間隠して、ネットワークに免疫力を持たせるように訓練できるという事実をシミュレートする。
本手法の有効性を,シングルカメラシーケンスのポーズを推定する最先端技術と比較した。
関連論文リスト
- Occlusion Robust 3D Human Pose Estimation with StridedPoseGraphFormer
and Data Augmentation [69.49430149980789]
提案手法は最先端技術(SoA)と良好に比較できることを示す。
また, 閉塞処理機構が存在しない場合には, SoA 3D HPE法の性能が著しく低下することが明らかとなった。
論文 参考訳(メタデータ) (2023-04-24T13:05:13Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Generating Band-Limited Adversarial Surfaces Using Neural Networks [0.9208007322096533]
逆の例は、分類ニューラルネットワークの入力信号に追加されるノイズを生成する技術である。
この技術的レポートでは、攻撃を発生させるニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-14T19:16:05Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - 3D Pose Detection in Videos: Focusing on Occlusion [0.4588028371034406]
我々は,映像中の隠蔽型3Dポーズ検出のための既存の手法を構築した。
我々は,2次元ポーズ予測を生成するために,積み重ねられた時間ガラスネットワークからなる2段階アーキテクチャを実装した。
閉鎖関節によるポーズの予測を容易にするため,シリンダーマンモデルの直感的な一般化を導入する。
論文 参考訳(メタデータ) (2020-06-24T07:01:17Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z) - 3D Human Pose Estimation using Spatio-Temporal Networks with Explicit
Occlusion Training [40.933783830017035]
近年の大きな進歩にもかかわらず、モノラルなタスクから3Dのポーズを推定することは依然として難しい課題である。
頑健な3次元ポーズ推定のための時間的ビデオネットワークを提案する。
本研究では,各フレームに2次元関節やキーポイントの予測,および3次元関節やキーポイントを推定するために,多段階の時間的畳み込みネットワーク(TCN)を適用した。
論文 参考訳(メタデータ) (2020-04-07T09:12:12Z) - A Graph Attention Spatio-temporal Convolutional Network for 3D Human
Pose Estimation in Video [7.647599484103065]
我々は,アテンション機構を用いた局所的グローバル空間情報のモデリングにより,人間の骨格における制約の学習を改善する。
提案手法は, 奥行きのあいまいさと自己閉塞性を効果的に軽減し, 半上半身推定を一般化し, 2次元から3次元映像のポーズ推定における競合性能を実現する。
論文 参考訳(メタデータ) (2020-03-11T14:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。