論文の概要: Learning Skeletal Graph Neural Networks for Hard 3D Pose Estimation
- arxiv url: http://arxiv.org/abs/2108.07181v1
- Date: Mon, 16 Aug 2021 15:42:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 14:58:11.178606
- Title: Learning Skeletal Graph Neural Networks for Hard 3D Pose Estimation
- Title(参考訳): ハード3次元ポーズ推定のための学習骨格グラフニューラルネットワーク
- Authors: Ailing Zeng, Xiao Sun, Lei Yang, Nanxuan Zhao, Minhao Liu, Qiang Xu
- Abstract要約: 本稿では, 深度あいまいさ, 自己閉塞性, 複雑なポーズを有するハードポーズに対する新しい骨格型GNN学習ソリューションを提案する。
Human3.6Mデータセットの実験結果から, 平均予測精度が10.3%向上したことがわかった。
- 参考スコア(独自算出の注目度): 14.413034040734477
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various deep learning techniques have been proposed to solve the single-view
2D-to-3D pose estimation problem. While the average prediction accuracy has
been improved significantly over the years, the performance on hard poses with
depth ambiguity, self-occlusion, and complex or rare poses is still far from
satisfactory. In this work, we target these hard poses and present a novel
skeletal GNN learning solution. To be specific, we propose a hop-aware
hierarchical channel-squeezing fusion layer to effectively extract relevant
information from neighboring nodes while suppressing undesired noises in GNN
learning. In addition, we propose a temporal-aware dynamic graph construction
procedure that is robust and effective for 3D pose estimation. Experimental
results on the Human3.6M dataset show that our solution achieves 10.3\% average
prediction accuracy improvement and greatly improves on hard poses over
state-of-the-art techniques. We further apply the proposed technique on the
skeleton-based action recognition task and also achieve state-of-the-art
performance. Our code is available at
https://github.com/ailingzengzzz/Skeletal-GNN.
- Abstract(参考訳): 単視点2次元から3次元のポーズ推定問題を解くために,様々なディープラーニング技術が提案されている。
平均予測精度は長年にわたって大幅に改善されてきたが、深度あいまいさ、自己閉塞性、複雑または稀なポーズなどのハードポーズのパフォーマンスは、まだ十分ではない。
本研究では,これらの難解なポーズを対象とし,新しい骨格型GNN学習ソリューションを提案する。
具体的には,gnn学習における望ましくないノイズを抑制しつつ,隣接ノードから関連情報を効果的に抽出するホップアウェア階層型チャネルスキーズ融合層を提案する。
さらに, 3次元ポーズ推定にロバストで効果的な時間対応動的グラフ構築手法を提案する。
Human3.6Mデータセットによる実験結果から,提案手法は平均予測精度10.3倍の精度向上を実現し,最先端技術によるハードポーズを大幅に改善することが示された。
さらに,提案手法を骨格に基づく動作認識タスクに適用し,最先端性能を実現する。
私たちのコードはhttps://github.com/ailingzengzzz/Skeletal-GNNで公開されています。
関連論文リスト
- SG-NeRF: Neural Surface Reconstruction with Scene Graph Optimization [16.460851701725392]
本稿では,外乱ポーズの影響を軽減するため,シーングラフを用いた放射場最適化手法を提案する。
本手法では,シーングラフに基づく適応型不整合・不整合信頼度推定手法を取り入れた。
また、カメラのポーズと表面形状を最適化するために、効果的な交叉結合(IoU)損失を導入する。
論文 参考訳(メタデータ) (2024-07-17T15:50:17Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - SplatPose & Detect: Pose-Agnostic 3D Anomaly Detection [18.796625355398252]
最先端のアルゴリズムは、ますます困難な設定やデータモダリティの欠陥を検出することができる。
本稿では,3次元ガウススプラッティングに基づくフレームワークSplatPoseを提案する。
競合手法に比べてトレーニングデータが少ない場合でも,トレーニング速度と推論速度,検出性能の両面で最先端の成果が得られている。
論文 参考訳(メタデータ) (2024-04-10T08:48:09Z) - Occlusion Resilient 3D Human Pose Estimation [52.49366182230432]
排除は、シングルカメラビデオシーケンスからの3Dボディポーズ推定における重要な課題の1つとして残されている。
単一カメラシーケンスからポーズを推測する最先端技術と比較して,このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-16T19:29:43Z) - NIKI: Neural Inverse Kinematics with Invertible Neural Networks for 3D
Human Pose and Shape Estimation [53.25973084799954]
両方向誤差をモデル化したNIKI(Neural Inverse Kinematics with Invertible Neural Network)を提案する。
NIKIは、非可逆ネットワークによる前処理と逆処理の両方から学習することができる。
論文 参考訳(メタデータ) (2023-05-15T12:13:24Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - Revisiting Skeleton-based Action Recognition [107.08112310075114]
PoseC3Dは骨格に基づく行動認識の新しいアプローチであり、代わりに人間の骨格のベース表現としてグラフシーケンスを積み重ねる3Dヒートマップに依存している。
4つの挑戦的なデータセットにおいて、PoseC3Dは、スケルトン上で単独で使用し、RGBモダリティと組み合わせることで、常に優れたパフォーマンスを得る。
論文 参考訳(メタデータ) (2021-04-28T06:32:17Z) - 3D Human Pose Estimation using Spatio-Temporal Networks with Explicit
Occlusion Training [40.933783830017035]
近年の大きな進歩にもかかわらず、モノラルなタスクから3Dのポーズを推定することは依然として難しい課題である。
頑健な3次元ポーズ推定のための時間的ビデオネットワークを提案する。
本研究では,各フレームに2次元関節やキーポイントの予測,および3次元関節やキーポイントを推定するために,多段階の時間的畳み込みネットワーク(TCN)を適用した。
論文 参考訳(メタデータ) (2020-04-07T09:12:12Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。