論文の概要: A hybrid classification-regression approach for 3D hand pose estimation
using graph convolutional networks
- arxiv url: http://arxiv.org/abs/2105.10902v1
- Date: Sun, 23 May 2021 10:09:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:30:19.404847
- Title: A hybrid classification-regression approach for 3D hand pose estimation
using graph convolutional networks
- Title(参考訳): グラフ畳み込みネットワークを用いた3次元ハンドポーズ推定のためのハイブリッド分類回帰手法
- Authors: Ikram Kourbane, Yakup Genc
- Abstract要約: 目的ごとの関係制約を学習する2段階のGCNベースのフレームワークを提案する。
第1フェーズは2D/3D空間を量子化し、その局所性に基づいて関節を2D/3Dブロックに分類する。
第2段階ではGCNベースのモジュールを使用し、隣り合う適応アルゴリズムを用いて関節関係を決定する。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Hand pose estimation is a crucial part of a wide range of augmented reality
and human-computer interaction applications. Predicting the 3D hand pose from a
single RGB image is challenging due to occlusion and depth ambiguities.
GCN-based (Graph Convolutional Networks) methods exploit the structural
relationship similarity between graphs and hand joints to model kinematic
dependencies between joints. These techniques use predefined or globally
learned joint relationships, which may fail to capture pose-dependent
constraints. To address this problem, we propose a two-stage GCN-based
framework that learns per-pose relationship constraints. Specifically, the
first phase quantizes the 2D/3D space to classify the joints into 2D/3D blocks
based on their locality. This spatial dependency information guides this phase
to estimate reliable 2D and 3D poses. The second stage further improves the 3D
estimation through a GCN-based module that uses an adaptative nearest neighbor
algorithm to determine joint relationships. Extensive experiments show that our
multi-stage GCN approach yields an efficient model that produces accurate 2D/3D
hand poses and outperforms the state-of-the-art on two public datasets.
- Abstract(参考訳): ハンドポーズ推定は、幅広い拡張現実および人間とコンピュータのインタラクションアプリケーションにおいて重要な部分である。
1枚のRGB画像から3Dハンドポーズを予測することは、閉塞と深さの曖昧さのために難しい。
GCN(Graph Convolutional Networks)法は、グラフと手関節の構造的類似性を利用して関節間の運動的依存関係をモデル化する。
これらのテクニックは事前に定義された、あるいはグローバルに学習された共同関係を使用し、ポーズ依存の制約を捕捉できない可能性がある。
そこで本稿では,関係制約を学習する2段階gcnベースのフレームワークを提案する。
具体的には、第1フェーズは2D/3D空間を定量化し、その局所性に基づいて関節を2D/3Dブロックに分類する。
この空間依存情報は、このフェーズを導いて信頼できる2dおよび3dポーズを推定する。
第2段階は、適応的近接アルゴリズムを用いて関節関係を決定するGCNベースのモジュールによる3次元推定をさらに改善する。
多段階のgcnアプローチは、正確な2d/3dハンドポーズを生成し、2つのパブリックデータセットの最先端技術を上回る効率的なモデルをもたらすことが、広範な実験で示されています。
関連論文リスト
- 3D Hand Reconstruction via Aggregating Intra and Inter Graphs Guided by
Prior Knowledge for Hand-Object Interaction Scenario [8.364378460776832]
モデルベースおよびモデルフリーアプローチの利点を生かした3次元ハンドリコンストラクションネットワークを提案する。
まず,2次元関節から直接のMANOポーズパラメータ回帰モジュールを提案する。
論文 参考訳(メタデータ) (2024-03-04T05:11:26Z) - Spatio-temporal MLP-graph network for 3D human pose estimation [8.267311047244881]
グラフ畳み込みネットワークとその変種は3次元人間のポーズ推定において大きな可能性を示している。
暗黙の伝搬フェアリングを用いたグラフフィルタリングにより得られる新しい重み付きヤコビ特徴則を導入する。
また, 関節間の関係を学習するために, 隣接変調を用いた。
論文 参考訳(メタデータ) (2023-08-29T14:00:55Z) - JOTR: 3D Joint Contrastive Learning with Transformers for Occluded Human
Mesh Recovery [84.67823511418334]
本稿では,3次元メッシュ復元のためのTRansformersフレームワークを用いた3次元ジョイントコントラスト学習について述べる。
提案手法は,2D$&$3D対応結果を得るために,2Dおよび3D表現を融合するエンコーダ・デコーダ変換器アーキテクチャを含む。
論文 参考訳(メタデータ) (2023-07-31T02:58:58Z) - Iterative Graph Filtering Network for 3D Human Pose Estimation [5.177947445379688]
グラフ畳み込みネットワーク(GCN)は3次元人間のポーズ推定に有効な手法であることが証明されている。
本稿では,3次元ポーズ推定のための反復グラフフィルタリングフレームワークを提案する。
我々のアプローチは、ラプラシア正規化によるグラフフィルタリングを反復的に解くという考え方に基づいている。
論文 参考訳(メタデータ) (2023-07-29T20:46:44Z) - Monocular 3D Reconstruction of Interacting Hands via Collision-Aware
Factorized Refinements [96.40125818594952]
単眼のRGB画像から3Dインタラクションハンドを再構築する試みを初めて行った。
提案手法では, 高精度な3次元ポーズと最小の衝突で3次元ハンドメッシュを生成することができる。
論文 参考訳(メタデータ) (2021-11-01T08:24:10Z) - Learning Dynamical Human-Joint Affinity for 3D Pose Estimation in Videos [47.601288796052714]
Graph Convolution Network (GCN)は、ビデオにおける3次元人間のポーズ推定に成功している。
新しい動的グラフネットワーク(DGNet)は、ビデオから空間的・時間的関節関係を適応的に学習することにより、3次元のポーズを推定できる。
論文 参考訳(メタデータ) (2021-09-15T15:06:19Z) - Graph-Based 3D Multi-Person Pose Estimation Using Multi-View Images [79.70127290464514]
我々は,タスクを2つの段階,すなわち人物のローカライゼーションとポーズ推定に分解する。
また,効率的なメッセージパッシングのための3つのタスク固有グラフニューラルネットワークを提案する。
提案手法は,CMU Panoptic と Shelf のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-13T11:44:07Z) - RGB2Hands: Real-Time Tracking of 3D Hand Interactions from Monocular RGB
Video [76.86512780916827]
本稿では,1台のRGBカメラによる骨格ポーズのモーションキャプチャと手の表面形状をリアルタイムに計測する手法を提案する。
RGBデータの本質的な深さの曖昧さに対処するために,我々は新しいマルチタスクCNNを提案する。
RGBの片手追跡と3D再構築パイプラインの個々のコンポーネントを実験的に検証した。
論文 参考訳(メタデータ) (2021-06-22T12:53:56Z) - HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation [7.559220068352681]
本稿では,2次元と3次元で手とオブジェクトのポーズをリアルタイムに推定するHOPE-Netという軽量モデルを提案する。
我々のネットワークは2つの適応グラフ畳み込みニューラルネットワークのカスケードを用いており、1つは手関節と物体角の2D座標を推定し、もう1つは2D座標を3Dに変換する。
論文 参考訳(メタデータ) (2020-03-31T19:01:42Z) - Fusing Wearable IMUs with Multi-View Images for Human Pose Estimation: A
Geometric Approach [76.10879433430466]
多視点画像と人手足に装着したIMUから3次元人間のポーズを推定する。
まず2つの信号から2Dのポーズを検出し、3D空間に持ち上げる。
単純な2段階のアプローチは、公開データセット上の大きなマージンによる最先端のエラーを低減する。
論文 参考訳(メタデータ) (2020-03-25T00:26:54Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。