論文の概要: Enhancing Monocular 3D Hand Reconstruction with Learned Texture Priors
- arxiv url: http://arxiv.org/abs/2508.09629v1
- Date: Wed, 13 Aug 2025 08:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.826368
- Title: Enhancing Monocular 3D Hand Reconstruction with Learned Texture Priors
- Title(参考訳): 学習したテクスチャ前駆体を用いた単眼3Dハンドレコンストラクションの強化
- Authors: Giorgos Karvounas, Nikolaos Kyriazis, Iason Oikonomidis, Georgios Pavlakos, Antonis A. Argyros,
- Abstract要約: 立体的手作りにおけるテクスチャの役割を再考し,光写実主義の余白としてではなく,密集した空間的に接地されたキューとして捉えた。
紫外線テクスチャ空間に画素ごとの観察を組み込む軽量なテクスチャモジュールを提案する。
結果として得られたシステムは精度とリアリズムの両方を改善し、手再建における外観誘導アライメントの価値を示す。
- 参考スコア(独自算出の注目度): 14.079851805480425
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We revisit the role of texture in monocular 3D hand reconstruction, not as an afterthought for photorealism, but as a dense, spatially grounded cue that can actively support pose and shape estimation. Our observation is simple: even in high-performing models, the overlay between predicted hand geometry and image appearance is often imperfect, suggesting that texture alignment may be an underused supervisory signal. We propose a lightweight texture module that embeds per-pixel observations into UV texture space and enables a novel dense alignment loss between predicted and observed hand appearances. Our approach assumes access to a differentiable rendering pipeline and a model that maps images to 3D hand meshes with known topology, allowing us to back-project a textured hand onto the image and perform pixel-based alignment. The module is self-contained and easily pluggable into existing reconstruction pipelines. To isolate and highlight the value of texture-guided supervision, we augment HaMeR, a high-performing yet unadorned transformer architecture for 3D hand pose estimation. The resulting system improves both accuracy and realism, demonstrating the value of appearance-guided alignment in hand reconstruction.
- Abstract(参考訳): 本研究は, モノクロ3次元手指再構築におけるテクスチャの役割を再考するものであり, フォトリアリズムの余白ではなく, ポーズと形状推定を積極的に支援できる密集した空間的接地キューとしての役割について考察する。
高い性能モデルであっても、予測手形状と画像の外観の間のオーバーレイはしばしば不完全であり、テクスチャアライメントが未使用の監視信号である可能性が示唆されている。
本稿では,UVテクスチャ空間に画素ごとの観察を埋め込む軽量なテクスチャモジュールを提案する。
提案手法では,画像からトポロジを3次元手メッシュにマッピングし,テクスチャを画像にバックプロジェクションし,ピクセルベースのアライメントを行う。
モジュールは自己完結型で、既存の再構築パイプラインに簡単にプラグインできる。
テクスチャ誘導による監視の価値を分離し,強調するために,3次元ポーズ推定のための高性能かつ非適応なトランスフォーマーアーキテクチャであるHaMeRを改良した。
結果として得られたシステムは精度とリアリズムの両方を改善し、手再建における外観誘導アライメントの価値を示す。
関連論文リスト
- HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.36376511119355]
モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文 参考訳(メタデータ) (2025-03-27T09:45:09Z) - HiFiHR: Enhancing 3D Hand Reconstruction from a Single Image via
High-Fidelity Texture [40.012406098563204]
一つの画像から学習フレームワークのレンダリング・アンド・コンパレンスを利用する高忠実手再構成手法であるHiFiHRを提案する。
FreiHAND や HO-3D などの公開ベンチマークによる実験結果から, テクスチャ再構築における手作り工法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-08-25T18:48:40Z) - Delicate Textured Mesh Recovery from NeRF via Adaptive Surface
Refinement [78.48648360358193]
画像からテクスチャ化された表面メッシュを生成する新しいフレームワークを提案する。
我々のアプローチは、NeRFを用いて幾何学とビュー依存の外観を効率的に初期化することから始まります。
ジオメトリと共同で外観を洗練し、テクスチャ画像に変換してリアルタイムレンダリングします。
論文 参考訳(メタデータ) (2023-03-03T17:14:44Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z) - ReFu: Refine and Fuse the Unobserved View for Detail-Preserving
Single-Image 3D Human Reconstruction [31.782985891629448]
シングルイメージの3次元再構成は,1枚の画像から人体の3次元テクスチャ面を再構築することを目的としている。
提案するReFuは、投影された背景像を精細化し、その精細な画像を融合して最終人体を予測するための粗大なアプローチである。
論文 参考訳(メタデータ) (2022-11-09T09:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。