論文の概要: Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose
Estimation
- arxiv url: http://arxiv.org/abs/2002.02033v1
- Date: Wed, 5 Feb 2020 23:05:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 21:48:05.422682
- Title: Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose
Estimation
- Title(参考訳): 2次元ハンドポース推定のための回転不変混合グラフモデルネットワーク
- Authors: Deying Kong, Haoyu Ma, Yifei Chen, Xiaohui Xie
- Abstract要約: 我々は、R-MGMN(Rotation-invariant Mixed Graphical Model Network)という新しいアーキテクチャを提案する。
回転ネットを統合することにより、R-MGMNは画像中の手の回転に不変である。
R-MGMNを2つの公開ポーズデータセットで評価する。
- 参考スコア(独自算出の注目度): 21.19641797725211
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a new architecture named Rotation-invariant Mixed
Graphical Model Network (R-MGMN) to solve the problem of 2D hand pose
estimation from a monocular RGB image. By integrating a rotation net, the
R-MGMN is invariant to rotations of the hand in the image. It also has a pool
of graphical models, from which a combination of graphical models could be
selected, conditioning on the input image. Belief propagation is performed on
each graphical model separately, generating a set of marginal distributions,
which are taken as the confidence maps of hand keypoint positions. Final
confidence maps are obtained by aggregating these confidence maps together. We
evaluate the R-MGMN on two public hand pose datasets. Experiment results show
our model outperforms the state-of-the-art algorithm which is widely used in 2D
hand pose estimation by a noticeable margin.
- Abstract(参考訳): 本稿では,単眼のrgb画像から2次元手ポーズ推定問題を解くために,回転不変型混合グラフィカルモデルネットワーク (r-mgmn) という新しいアーキテクチャを提案する。
回転ネットを統合することにより、R-MGMNは画像中の手の回転に不変である。
グラフィックモデルのプールも用意されており、入力イメージを条件付けして、グラフィカルモデルの組み合わせを選択できる。
各グラフィカルモデル上では、信念伝播が別々に行われ、手のキーポイント位置の信頼度マップとして取られる一連の限界分布を生成する。
最終信頼度マップは、これらの信頼度マップをまとめることで得られる。
2つのパブリックハンドポーズデータセット上でR-MGMNを評価する。
実験の結果,本モデルは2次元手ポーズ推定において顕著なマージンで広く用いられている最先端のアルゴリズムよりも優れていた。
関連論文リスト
- HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud [60.47544798202017]
ハンドポーズ推定は、様々な人間とコンピュータの相互作用アプリケーションにおいて重要なタスクである。
本論文は,手形画像点雲上での正確な手ポーズを反復的に認知する拡散型手ポーズ推定モデルであるHandDiffを提案する。
実験の結果,提案したHandDiffは,4つの挑戦的なハンドポーズベンチマークデータセットにおいて,既存のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-04-04T02:15:16Z) - Learning Gaussian Representation for Eye Fixation Prediction [54.88001757991433]
既存のアイ固定予測方法は、入力画像から原固定点から生成された対応する濃密な固定マップへのマッピングを行う。
本稿ではアイフィグレーションモデリングのためのガウス表現について紹介する。
我々は,リアルタイムな固定予測を実現するために,軽量なバックボーン上にフレームワークを設計する。
論文 参考訳(メタデータ) (2024-03-21T20:28:22Z) - MeMaHand: Exploiting Mesh-Mano Interaction for Single Image Two-Hand
Reconstruction [19.82874341207336]
メッシュを再構築し、単一のRGB画像から2つの手のMANOパラメータを同時に推定する。
MMIBは、局所情報を集約するために1つのグラフ残差ブロックと、長距離依存をモデル化するために2つのトランスフォーマーエンコーダから構成される。
InterHand2.6Mベンチマークの実験は、最先端の手再構成法に対して有望な結果を示した。
論文 参考訳(メタデータ) (2023-03-28T04:06:02Z) - HandNeRF: Neural Radiance Fields for Animatable Interacting Hands [122.32855646927013]
神経放射場(NeRF)を用いて手の動きを正確に再現する新しい枠組みを提案する。
我々は,提案するHandNeRFのメリットを検証するための広範囲な実験を行い,その成果を報告する。
論文 参考訳(メタデータ) (2023-03-24T06:19:19Z) - Real-time Pose and Shape Reconstruction of Two Interacting Hands With a
Single Depth Camera [79.41374930171469]
本稿では,2つの強く相互作用する手の位置と形状をリアルタイムに再現する新しい手法を提案する。
われわれのアプローチは、有利なプロパティの広範なリスト、すなわちマーカーレスを組み合わせている。
過去の研究で示された複雑性レベルを超える場面で、最先端の結果を示す。
論文 参考訳(メタデータ) (2021-06-15T11:39:49Z) - Skeleton-aware multi-scale heatmap regression for 2D hand pose
estimation [1.0152838128195467]
本稿では,2つの主要モジュールからなるディープラーニングベースのフレームワークを提案する。
前者は、手骨を検知し、手の境界ボックスをローカライズするセグメンテーションベースのアプローチを提案する。
第2のモジュールは、マルチスケールのヒートマップ回帰アプローチを通じて2次元関節位置を回帰する。
論文 参考訳(メタデータ) (2021-05-23T10:23:51Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Parallel mesh reconstruction streams for pose estimation of interacting
hands [2.0305676256390934]
単一のRGB画像から手動ポーズ推定を行うマルチストリーム3Dメッシュ再構成ネットワーク(MSMR-Net)を提案する。
我々のモデルは、画像エンコーダと、連結グラフ畳み込み層からなるメッシュ畳み込みデコーダからなる。
論文 参考訳(メタデータ) (2021-04-25T10:14:15Z) - Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。
また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文 参考訳(メタデータ) (2020-07-09T13:23:15Z) - Adaptive Graphical Model Network for 2D Handpose Estimation [19.592024471753025]
単眼RGB画像からの2次元手ポーズ推定の課題に対処する新しいアーキテクチャを提案する。
アダプティブ・グラフィカル・モデル・ネットワーク(Adaptive Graphical Model Network, AGMN)は、単一のポテンシャル関数とペアのポテンシャル関数を計算するための深部畳み込みニューラルネットワークの2つの枝からなる。
提案手法は,2つの公開データセットに対する顕著なマージンによる2次元手指キーポイント推定における最先端手法よりも優れている。
論文 参考訳(メタデータ) (2019-09-18T04:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。