論文の概要: Towards Egocentric 3D Hand Pose Estimation in Unseen Domains
- arxiv url: http://arxiv.org/abs/2601.06537v1
- Date: Sat, 10 Jan 2026 11:36:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.867945
- Title: Towards Egocentric 3D Hand Pose Estimation in Unseen Domains
- Title(参考訳): 目に見えない領域におけるエゴセントリックな3Dハンドポース推定に向けて
- Authors: Wiktor Mucha, Michael Wray, Martin Kampel,
- Abstract要約: V-HPOTは、3Dハンドポーズ推定のクロスドメイン性能を改善するための新しいアプローチである。
仮想カメラ空間におけるキーポイントz座標を推定することで、この問題に対処する。
自己監督テストタイム最適化戦略は、推論中のモデルの深度知覚を洗練させる。
- 参考スコア(独自算出の注目度): 12.514577938360574
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present V-HPOT, a novel approach for improving the cross-domain performance of 3D hand pose estimation from egocentric images across diverse, unseen domains. State-of-the-art methods demonstrate strong performance when trained and tested within the same domain. However, they struggle to generalise to new environments due to limited training data and depth perception -- overfitting to specific camera intrinsics. Our method addresses this by estimating keypoint z-coordinates in a virtual camera space, normalised by focal length and image size, enabling camera-agnostic depth prediction. We further leverage this invariance to camera intrinsics to propose a self-supervised test-time optimisation strategy that refines the model's depth perception during inference. This is achieved by applying a 3D consistency loss between predicted and in-space scale-transformed hand poses, allowing the model to adapt to target domain characteristics without requiring ground truth annotations. V-HPOT significantly improves 3D hand pose estimation performance in cross-domain scenarios, achieving a 71% reduction in mean pose error on the H2O dataset and a 41% reduction on the AssemblyHands dataset. Compared to state-of-the-art methods, V-HPOT outperforms all single-stage approaches across all datasets and competes closely with two-stage methods, despite needing approximately x3.5 to x14 less data.
- Abstract(参考訳): V-HPOT(V-HPOT)は,多種多様な未知領域にまたがる自我中心画像から3次元手ポーズ推定のクロスドメイン性能を改善するための新しい手法である。
State-of-the-artメソッドは、同じドメイン内でトレーニングとテストを行うときに、強いパフォーマンスを示す。
しかし、訓練データや深度知覚が特定のカメラ固有のものに過度に適合するため、新しい環境への一般化に苦慮している。
本手法は,焦点距離と画像サイズによって正規化された仮想カメラ空間内のキーポイントz座標を推定することにより,カメラ非依存の深度予測を可能にする。
さらに、この不均一性を利用して、推論中のモデルの深度知覚を洗練させる自己教師付きテスト時間最適化戦略を提案する。
これは、予測されたスケール変換された手ポーズと空間内のスケール変換された手ポーズの間に3次元の整合性損失を適用することで実現される。
V-HPOTは、ドメイン横断シナリオにおける3次元ポーズ推定性能を大幅に改善し、H2Oデータセットの平均ポーズ誤差を71%削減し、AmblyHandsデータセットを41%削減した。
最先端の手法と比較して、V-HPOTはすべてのデータセットのシングルステージアプローチよりも優れており、約x3.5からx14の少ないデータを必要とするにもかかわらず、2ステージメソッドと密接に競合する。
関連論文リスト
- Direction-Aware Hybrid Representation Learning for 3D Hand Pose and Shape Estimation [41.96019347138128]
暗黙的な画像特徴と明示的な2次元共同座標特徴を融合する学習方向対応ハイブリッド特徴(DaHyF)を提案する。
提案手法は,DAHyF表現による3次元手振りを直接予測し,コントラスト学習に基づく予測信頼度を用いて,モーションキャプチャ時のジッタリングを低減する。
論文 参考訳(メタデータ) (2025-04-02T02:06:23Z) - HandDGP: Camera-Space Hand Mesh Prediction with Differentiable Global Positioning [1.4515751892711464]
本稿では,2D-3D対応問題に対処するエンドツーエンドソリューションを提案する。
このソリューションは、新しい差別化可能なグローバル位置決めモジュールを通じて、カメラ空間出力からネットワークの他の部分へのバックプロパゲーションを可能にする。
いくつかのベースラインと最先端のアプローチに対する評価において、我々のフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-07-22T17:59:01Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - Towards Domain Generalization for Multi-view 3D Object Detection in
Bird-Eye-View [11.958753088613637]
まず,MV3D-Detタスクにおける領域ギャップの原因を解析する。
頑健な深度予測を得るために,カメラの内在パラメータから深度推定を分離する手法を提案する。
焦点長の値を変更して複数の擬似ドメインを作成し、敵の訓練損失を発生させ、特徴表現をよりドメインに依存しないものにするよう促す。
論文 参考訳(メタデータ) (2023-03-03T02:59:13Z) - Wide-Baseline Relative Camera Pose Estimation with Directional Learning [46.21836501895394]
提案するDirectionNetは,新しいパラメータ化を用いて5次元相対ポーズ空間上の離散分布を推定し,推定問題を抽出できるようにする。
本研究では,Matterport3DとInstituteNetから構築した合成・実ポーズ推定データセットについて検討した。
論文 参考訳(メタデータ) (2021-06-07T04:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。