論文の概要: Learning Skeletal Graph Neural Networks for Hard 3D Pose Estimation
- arxiv url: http://arxiv.org/abs/2108.07181v2
- Date: Tue, 17 Aug 2021 05:01:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 13:30:19.717459
- Title: Learning Skeletal Graph Neural Networks for Hard 3D Pose Estimation
- Title(参考訳): ハード3次元ポーズ推定のための学習骨格グラフニューラルネットワーク
- Authors: Ailing Zeng, Xiao Sun, Lei Yang, Nanxuan Zhao, Minhao Liu, Qiang Xu
- Abstract要約: 本稿では, 深度あいまいさ, 自己閉塞性, 複雑なポーズを有するハードポーズに対する新しい骨格型GNN学習ソリューションを提案する。
Human3.6Mデータセットの実験結果から, 平均予測精度が10.3%向上したことがわかった。
- 参考スコア(独自算出の注目度): 14.413034040734477
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various deep learning techniques have been proposed to solve the single-view
2D-to-3D pose estimation problem. While the average prediction accuracy has
been improved significantly over the years, the performance on hard poses with
depth ambiguity, self-occlusion, and complex or rare poses is still far from
satisfactory. In this work, we target these hard poses and present a novel
skeletal GNN learning solution. To be specific, we propose a hop-aware
hierarchical channel-squeezing fusion layer to effectively extract relevant
information from neighboring nodes while suppressing undesired noises in GNN
learning. In addition, we propose a temporal-aware dynamic graph construction
procedure that is robust and effective for 3D pose estimation. Experimental
results on the Human3.6M dataset show that our solution achieves 10.3\% average
prediction accuracy improvement and greatly improves on hard poses over
state-of-the-art techniques. We further apply the proposed technique on the
skeleton-based action recognition task and also achieve state-of-the-art
performance. Our code is available at
https://github.com/ailingzengzzz/Skeletal-GNN.
- Abstract(参考訳): 単視点2次元から3次元のポーズ推定問題を解くために,様々なディープラーニング技術が提案されている。
平均予測精度は長年にわたって大幅に改善されてきたが、深度あいまいさ、自己閉塞性、複雑または稀なポーズなどのハードポーズのパフォーマンスは、まだ十分ではない。
本研究では,これらの難解なポーズを対象とし,新しい骨格型GNN学習ソリューションを提案する。
具体的には,gnn学習における望ましくないノイズを抑制しつつ,隣接ノードから関連情報を効果的に抽出するホップアウェア階層型チャネルスキーズ融合層を提案する。
さらに, 3次元ポーズ推定にロバストで効果的な時間対応動的グラフ構築手法を提案する。
Human3.6Mデータセットによる実験結果から,提案手法は平均予測精度10.3倍の精度向上を実現し,最先端技術によるハードポーズを大幅に改善することが示された。
さらに,提案手法を骨格に基づく動作認識タスクに適用し,最先端性能を実現する。
私たちのコードはhttps://github.com/ailingzengzzz/Skeletal-GNNで公開されています。
関連論文リスト
- Occlusion Resilient 3D Human Pose Estimation [52.49366182230432]
排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つとして残されている。
単一カメラシーケンスからポーズを推測する最先端技術と比較して,このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-16T19:29:43Z) - Improving 3D Pose Estimation for Sign Language [38.20064386142944]
この研究は、単一の画像における3次元人間のポーズ復元に対処する。
本稿では,フォワード・キネマティクス(FK)とニューラルネットワークを組み合わせた3次元ポーズの高速かつ有効な予測手法を提案する。
論文 参考訳(メタデータ) (2023-08-18T13:05:10Z) - NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D
Human Pose and Shape Estimation [53.25973084799954]
両方向誤差をモデル化したNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。
NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
論文 参考訳(メタデータ) (2023-05-15T12:13:24Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - Revisiting Skeleton-based Action Recognition [107.08112310075114]
PoseC3Dは骨格に基づく行動認識の新しいアプローチであり、代わりに人間の骨格のベース表現としてグラフシーケンスを積み重ねる3Dヒートマップに依存している。
4つの挑戦的なデータセットにおいて、PoseC3Dは、スケルトン上で単独で使用し、RGBモダリティと組み合わせることで、常に優れたパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-04-28T06:32:17Z) - Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage
Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。
既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。
頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-13T15:24:28Z) - 3D Human Pose Estimation using Spatio-Temporal Networks with Explicit
Occlusion Training [40.933783830017035]
近年の大きな進歩にもかかわらず、モノラルなタスクから3Dのポーズを推定することは依然として難しい課題である。
頑健な3次元ポーズ推定のための時間的ビデオネットワークを提案する。
本研究では,各フレームに2次元関節やキーポイントの予測,および3次元関節やキーポイントを推定するために,多段階の時間的畳み込みネットワーク(TCN)を適用した。
論文 参考訳(メタデータ) (2020-04-07T09:12:12Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。