論文の概要: Improving 3D Pose Estimation for Sign Language
- arxiv url: http://arxiv.org/abs/2308.09525v1
- Date: Fri, 18 Aug 2023 13:05:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 13:07:23.747015
- Title: Improving 3D Pose Estimation for Sign Language
- Title(参考訳): 手話における3次元ポーズ推定の改善
- Authors: Maksym Ivashechkin, Oscar Mendez, Richard Bowden
- Abstract要約: この研究は、単一の画像における3次元人間のポーズ復元に対処する。
本稿では,フォワード・キネマティクス(FK)とニューラルネットワークを組み合わせた3次元ポーズの高速かつ有効な予測手法を提案する。
- 参考スコア(独自算出の注目度): 38.20064386142944
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work addresses 3D human pose reconstruction in single images. We present
a method that combines Forward Kinematics (FK) with neural networks to ensure a
fast and valid prediction of 3D pose. Pose is represented as a hierarchical
tree/graph with nodes corresponding to human joints that model their physical
limits. Given a 2D detection of keypoints in the image, we lift the skeleton to
3D using neural networks to predict both the joint rotations and bone lengths.
These predictions are then combined with skeletal constraints using an FK layer
implemented as a network layer in PyTorch. The result is a fast and accurate
approach to the estimation of 3D skeletal pose. Through quantitative and
qualitative evaluation, we demonstrate the method is significantly more
accurate than MediaPipe in terms of both per joint positional error and visual
appearance. Furthermore, we demonstrate generalization over different datasets.
The implementation in PyTorch runs at between 100-200 milliseconds per image
(including CNN detection) using CPU only.
- Abstract(参考訳): 本研究は,人間の3次元ポーズ再構成を単一画像で表現する。
本稿では,フォワードキネマティックス(fk)とニューラルネットワークを組み合わせた3dポーズの迅速かつ有効な予測手法を提案する。
ポーズは、物理的な限界をモデル化する人間の関節に対応するノードを持つ階層木/グラフとして表現される。
画像中のキーポイントを2Dで検出すると、ニューラルネットワークを用いて骨格を3Dに上げ、関節の回転と骨の長さを予測する。
これらの予測は、PyTorchのネットワーク層として実装されたFKレイヤを使用して、骨格制約と組み合わせられる。
その結果,3次元骨格ポーズ推定の迅速かつ正確な手法が得られた。
定量的および定性的評価により, 関節位置誤差と視覚的外観の両方において, MediaPipe よりも有意に精度が高いことを示す。
さらに,異なるデータセットに対する一般化を示す。
PyTorchの実装はCPUのみを使用して、画像毎の100-200ミリ秒(CNN検出を含む)で動作する。
関連論文リスト
- Co-Evolution of Pose and Mesh for 3D Human Body Estimation from Video [23.93644678238666]
ビデオから3次元の人間の動きを復元するPose and Mesh Co-Evolution Network (PMCE)を提案する。
提案したPMCEは、フレーム単位の精度と時間的一貫性の両方の観点から、従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-08-20T16:03:21Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - GCNDepth: Self-supervised Monocular Depth Estimation based on Graph
Convolutional Network [11.332580333969302]
この研究は、深度マップの量的および質的な理解を高めるために、一連の改善を伴う新しいソリューションをもたらす。
グラフ畳み込みネットワーク(GCN)は、非ユークリッドデータ上の畳み込みを処理でき、位相構造内の不規則な画像領域に適用することができる。
提案手法は,公的なKITTIおよびMake3Dデータセットに対して,高い予測精度で89%の精度で同等かつ有望な結果を与える。
論文 参考訳(メタデータ) (2021-12-13T16:46:25Z) - Learning Temporal 3D Human Pose Estimation with Pseudo-Labels [3.0954251281114513]
自己監督型3次元ポーズ推定のための簡易かつ効果的なアプローチを提案する。
我々は、マルチビューカメラシステムの2Dボディポーズ推定を三角測量に頼っている。
提案手法はHuman3.6MとMPI-INF-3DHPベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2021-10-14T17:40:45Z) - 3D Human Pose Regression using Graph Convolutional Network [68.8204255655161]
本稿では,2次元のポーズから3次元のポーズ回帰を行うために,PoseGraphNetというグラフ畳み込みネットワークを提案する。
我々のモデルの性能は最先端に近いが、パラメータははるかに少ない。
論文 参考訳(メタデータ) (2021-05-21T14:41:31Z) - HybrIK: A Hybrid Analytical-Neural Inverse Kinematics Solution for 3D
Human Pose and Shape Estimation [39.67289969828706]
本稿では,体メッシュ推定と3次元キーポイント推定のギャップを埋めるために,新しいハイブリッド逆キネマティクスソリューション(HybrIK)を提案する。
HybrIKは、正確な3D関節を相対的なボディ部分回転に変換し、3Dボディーメッシュを再構築する。
その結果,HybrIKは3次元ポーズの精度とパラメトリックな人間の身体構造の両方を保っていることがわかった。
論文 参考訳(メタデータ) (2020-11-30T10:32:30Z) - Pose2Mesh: Graph Convolutional Network for 3D Human Pose and Mesh
Recovery from a 2D Human Pose [70.23652933572647]
本稿では,人間のメッシュ頂点の3次元座標を直接推定するグラフ畳み込みニューラルネットワーク(GraphCNN)を提案する。
我々のPose2Meshは、様々なベンチマークデータセットにおいて、以前の3次元人間のポーズとメッシュ推定方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-20T16:01:56Z) - HDNet: Human Depth Estimation for Multi-Person Camera-Space Localization [83.57863764231655]
本稿では,根の絶対的局所化のためのエンドツーエンドフレームワークであるHuman Depth Estimation Network (HDNet)を提案する。
関節間の特徴伝達に骨格ベースのグラフニューラルネットワーク(GNN)を用いる。
我々は,2つのベンチマークデータセットを用いて,ルートジョイントローカライゼーションとルート相対的な3次元ポーズ推定タスクについて,HDNetの評価を行った。
論文 参考訳(メタデータ) (2020-07-17T12:44:23Z) - HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation [7.559220068352681]
本稿では,2次元と3次元で手とオブジェクトのポーズをリアルタイムに推定するHOPE-Netという軽量モデルを提案する。
我々のネットワークは2つの適応グラフ畳み込みニューラルネットワークのカスケードを用いており、1つは手関節と物体角の2D座標を推定し、もう1つは2D座標を3Dに変換する。
論文 参考訳(メタデータ) (2020-03-31T19:01:42Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。