論文の概要: DeltaDorsal: Enhancing Hand Pose Estimation with Dorsal Features in Egocentric Views
- arxiv url: http://arxiv.org/abs/2601.15516v2
- Date: Mon, 26 Jan 2026 18:45:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:06.910091
- Title: DeltaDorsal: Enhancing Hand Pose Estimation with Dorsal Features in Egocentric Views
- Title(参考訳): DeltaDorsal:エゴセントリックな視点におけるDorsal特徴を用いたハンドポース推定の強化
- Authors: William Huang, Siyou Pei, Leyi Zou, Eric J. Gonzalez, Ishan Chatterjee, Yang Zhang,
- Abstract要約: 動的手とベースライン緩和位置との特徴を対比することでポーズを学習するデュアルストリームデルタエンコーダを提案する。
本手法は,自己閉塞シナリオにおいてMPJAE(Mean Per Joint Angle Error)を18%削減する。
- 参考スコア(独自算出の注目度): 11.698905867819837
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of XR devices has made egocentric hand pose estimation a vital task, yet this perspective is inherently challenged by frequent finger occlusions. To address this, we propose a novel approach that leverages the rich information in dorsal hand skin deformation, unlocked by recent advances in dense visual featurizers. We introduce a dual-stream delta encoder that learns pose by contrasting features from a dynamic hand with a baseline relaxed position. Our evaluation demonstrates that, using only cropped dorsal images, our method reduces the Mean Per Joint Angle Error (MPJAE) by 18% in self-occluded scenarios (fingers >= 50% occluded) compared to state-of-the-art techniques that depend on the whole hand's geometry and large model backbones. Consequently, our method not only enhances the reliability of downstream tasks like index finger pinch and tap estimation in occluded scenarios but also unlocks new interaction paradigms, such as detecting isometric force for a surface "click" without visible movement while minimizing model size.
- Abstract(参考訳): XRデバイスの普及により、自我中心の手ポーズ推定が重要な課題となっているが、この視点は、しばしば指の閉塞によって本質的に挑戦されている。
そこで本研究では,近年の高密度視覚デファクトライザの進歩により,背手皮膚の変形に関する豊富な情報を活用する新しい手法を提案する。
動的手とベースライン緩和位置との特徴を対比することでポーズを学習するデュアルストリームデルタエンコーダを提案する。
提案手法は, 収穫した背骨画像のみを用いて, 手の形状や大きめのモデル背骨に依存する最先端技術と比較して, 自己閉塞シナリオ(指 >=50% 閉塞)において, 平均手関節角度誤差(MPJAE)を18%低減することを示した。
その結果,本手法は, アクセントフィンチやタップ推定などの下流作業の信頼性を高めるだけでなく, モデルサイズを最小化しながら, 目に見える動きを伴わずに表面の「クリック」の等尺力を検出するなど, 新たな相互作用パラダイムを開放する。
関連論文リスト
- HandDAGT: A Denoising Adaptive Graph Transformer for 3D Hand Pose Estimation [15.606904161622017]
本稿では,ハンドポーズ推定のためのDenoising Adaptive Graph Transformer(HandDAGT)を提案する。
特定のキーポイントを推定するための運動対応と局所幾何学的特徴の寄与を適応的に評価する新しい注意機構が組み込まれている。
実験の結果,提案手法は4つの手ポーズベンチマークデータセットにおいて,既存の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2024-07-30T04:53:35Z) - HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud [60.47544798202017]
ハンドポーズ推定は、様々な人間とコンピュータの相互作用アプリケーションにおいて重要なタスクである。
本論文は,手形画像点雲上での正確な手ポーズを反復的に認知する拡散型手ポーズ推定モデルであるHandDiffを提案する。
実験の結果,提案したHandDiffは,4つの挑戦的なハンドポーズベンチマークデータセットにおいて,既存のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-04-04T02:15:16Z) - D-SCo: Dual-Stream Conditional Diffusion for Monocular Hand-Held Object Reconstruction [74.49121940466675]
モノクローナルハンドヘルドオブジェクト再構成のためのCentroid-fixed dual-stream conditionalfusionを導入する。
まず、対象のセントロイドがずれることを避けるために、手動制約付きセントロイド固定パラダイムを用いる。
第2に、意味的および幾何学的に手動物体の相互作用をモデル化するための二重ストリームデノイザを導入する。
論文 参考訳(メタデータ) (2023-11-23T20:14:50Z) - HandNeRF: Neural Radiance Fields for Animatable Interacting Hands [122.32855646927013]
神経放射場(NeRF)を用いて手の動きを正確に再現する新しい枠組みを提案する。
我々は,提案するHandNeRFのメリットを検証するための広範囲な実験を行い,その成果を報告する。
論文 参考訳(メタデータ) (2023-03-24T06:19:19Z) - Deformer: Dynamic Fusion Transformer for Robust Hand Pose Estimation [59.3035531612715]
既存の方法では、手のこもりが強かったり、ぼやけたりすると、手のポーズが難しい場合が多い。
ビデオでは、手の動きによって、片方のフレームに隠されたり、ぼやけたりして、手のさまざまな部分を観察することができる。
画像内の手の部分間の関係を暗黙的に推論するフレームワークであるDeformerを提案する。
論文 参考訳(メタデータ) (2023-03-09T02:24:30Z) - Generative Model-Based Loss to the Rescue: A Method to Overcome
Annotation Errors for Depth-Based Hand Pose Estimation [76.12736932610163]
本稿では,モデルに基づく生成損失を,ボリュームハンドモデルに基づく深度画像に基づく手ポーズ推定器の訓練に用いることを提案する。
この追加的な損失により、手振り推定器のトレーニングが可能となり、21個の手書きキーポイントのセット全体を正確に推測すると同時に、6つの手書きキーポイント(フィンガーチップと手首)の監視のみを使用する。
論文 参考訳(メタデータ) (2020-07-06T21:24:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。