論文の概要: HandDreamer: Zero-Shot Text to 3D Hand Model Generation using Corrective Hand Shape Guidance
- arxiv url: http://arxiv.org/abs/2604.04425v1
- Date: Mon, 06 Apr 2026 05:14:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.096027
- Title: HandDreamer: Zero-Shot Text to 3D Hand Model Generation using Corrective Hand Shape Guidance
- Title(参考訳): HandDreamer:修正ハンド形状誘導を用いたゼロショットテキストから3次元ハンドモデル生成
- Authors: Green Rosh, Prateek Kukreja, Vishakha SR, Pawan Prasad B H,
- Abstract要約: 我々はテキストプロンプトからゼロショット3Dハンドモデルを生成する最初の方法であるHandDreamerを紹介する。
以上の結果から,SDSの視線不整合は主に確率環境の曖昧さに起因することが示唆された。
本稿では,3次元ハンドモデルのすべてのビューがビュー一貫性モードに収束することを保証するために,新しい修正手形誘導損失を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The emergence of virtual reality has necessitated the generation of detailed and customizable 3D hand models for interaction in the virtual world. However, the current methods for 3D hand model generation are both expensive and cumbersome, offering very little customizability to the users. While recent advancements in zero-shot text-to-3D synthesis have enabled the generation of diverse and customizable 3D models using Score Distillation Sampling (SDS), they do not generalize very well to 3D hand model generation, resulting in unnatural hand structures, view-inconsistencies and loss of details. To address these limitations, we introduce HandDreamer, the first method for zero-shot 3D hand model generation from text prompts. Our findings suggest that view-inconsistencies in SDS is primarily caused due to the ambiguity in the probability landscape described by the text prompt, resulting in similar views converging to different modes of the distribution. This is particularly aggravated for hands due to the large variations in articulations and poses. To alleviate this, we propose to use MANO hand model based initialization and a hand skeleton guided diffusion process to provide a strong prior for the hand structure and to ensure view and pose consistency. Further, we propose a novel corrective hand shape guidance loss to ensure that all the views of the 3D hand model converges to view-consistent modes, without leading to geometric distortions. Extensive evaluations demonstrate the superiority of our method over the state-of-the-art methods, paving a new way forward in 3D hand model generation.
- Abstract(参考訳): バーチャルリアリティーの出現は、バーチャルワールドにおけるインタラクションのための詳細でカスタマイズ可能な3Dハンドモデルの生成を必要としている。
しかし、現在の3Dハンドモデル生成の方法は高価で扱いにくいため、ユーザにとって非常にカスタマイズ性が少ない。
ゼロショットテキストから3D合成の最近の進歩により、スコア蒸留サンプリング(SDS)を用いた多種多様なカスタマイズ可能な3Dモデルの生成が可能になったが、これらは3Dハンドモデル生成にはあまり適していないため、不自然な手構造、視界の不整合、詳細の喪失をもたらす。
これらの制約に対処するために,テキストプロンプトからゼロショット3Dハンドモデルを生成する最初の手法であるHandDreamerを導入する。
以上の結果から,SDSの視線不整合は主にテキストプロンプトによって記述される確率景観の曖昧さに起因することが示唆された。
これは特に、調音やポーズに大きなバリエーションがあるため、手にとって悪化している。
そこで本研究では,MANOハンドモデルに基づく初期化と手骨誘導拡散プロセスを用いて,手の構造に強い先行性を与え,視界と整合性を確保することを提案する。
さらに、3次元ハンドモデルのすべてのビューが、幾何学的歪みを伴わずに、ビュー一貫性モードに収束することを保証するために、新しい修正手形誘導損失を提案する。
広範囲な評価により,本手法が最先端の手法よりも優れていることが示され,3次元ハンドモデル生成における新たな方向性が示された。
関連論文リスト
- 3D Hand Mesh-Guided AI-Generated Malformed Hand Refinement with Hand Pose Transformation via Diffusion Model [40.20849519857311]
本稿では,拡散パイプラインを用いた3次元メッシュ誘導精製フレームワークを提案する。
トレーニングのために、RGB画像と3Dハンドメッシュからなるデータセットを収集し、再注釈する。
次に,3次元ハンドメッシュで導かれる洗練された出力を生成する拡散塗装モデルを設計する。
論文 参考訳(メタデータ) (2025-06-15T01:30:22Z) - JGHand: Joint-Driven Animatable Hand Avater via 3D Gaussian Splatting [3.1143479095236892]
Jointly 3D Gaussian Hand (JGHand)は、新しい3D Gaussian Splatting (3DGS)ベースの手表現である。
JGHandは、最先端の手法を超越した、高品質なリアルタイムレンダリングを実現する。
論文 参考訳(メタデータ) (2025-01-31T12:33:24Z) - HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions [68.28684509445529]
HandBoosterは、データの多様性を向上し、3Dハンド・ミーシュ・リコンストラクションのパフォーマンスを向上する新しいアプローチである。
まず,多様な手やポーズ,ビュー,背景を持つリアルな画像を生成するために,拡散モデルを誘導する多目的コンテンツ認識条件を構築した。
そこで我々は,我々の類似性を考慮した分布サンプリング戦略に基づく新しい条件作成手法を設計し,トレーニングセットとは異なる,斬新で現実的なインタラクションのポーズを意図的に見つける。
論文 参考訳(メタデータ) (2024-03-27T13:56:08Z) - HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances [34.50137847908887]
テキスト・ツー・イメージ生成モデルは高品質な人間を生み出すことができるが、現実主義は手を生成する際に失われる。
一般的なアーティファクトには、不規則な手ポーズ、形、不正確な指の数、物理的に不明瞭な指の向きなどがある。
そこで我々はHanDiffuserという新しい拡散型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-04T03:00:22Z) - HumanRef: Single Image to 3D Human Generation via Reference-Guided
Diffusion [53.1558345421646]
単一ビュー入力から3次元のヒューマン生成フレームワークであるHumanRefを提案する。
生成した3Dモデルが入力画像と光写実的に整合していることを保証するため、HumanRefは参照誘導スコア蒸留サンプリングと呼ばれる新しい手法を導入した。
実験結果から,HumanRefは3D衣服を製作する上で,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-11-28T17:06:28Z) - Overcoming the Trade-off Between Accuracy and Plausibility in 3D Hand
Shape Reconstruction [62.96478903239799]
3次元手形状復元のための直接メッシュフィッティングは非常に正確である。
しかし、再建されたメッシュはアーティファクトに傾向があり、もっともらしい手の形には見えない。
本稿では,MANOモデルと非パラメトリックメッシュフィッティングをエンドツーエンドで統合した手形状推定フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-01T03:38:01Z) - Embodied Hands: Modeling and Capturing Hands and Bodies Together [61.32931890166915]
人間は、コミュニケーションとタスクの解決のために、手と体を一緒に移動します。
ほとんどの方法は、体と手の3Dモデリングと追跡を別々に扱う。
我々は、手と体の相互作用をモデルとして定式化し、それをフルボディの4Dシーケンスに適合させる。
論文 参考訳(メタデータ) (2022-01-07T18:59:32Z) - A Skeleton-Driven Neural Occupancy Representation for Articulated Hands [49.956892429789775]
Hand ArticuLated Occupancy (HALO) は、3Dキーポイントと神経暗黙の面の利点を橋渡しする手話の表現である。
本研究では,3次元物体を把握した手の条件生成作業に対するHALOの適用性を示す。
論文 参考訳(メタデータ) (2021-09-23T14:35:19Z) - MM-Hand: 3D-Aware Multi-Modal Guided Hand Generative Network for 3D Hand
Pose Synthesis [81.40640219844197]
モノラルなRGB画像から3Dハンドポーズを推定することは重要だが難しい。
解決策は、高精度な3D手指キーポイントアノテーションを用いた大規模RGB手指画像のトレーニングである。
我々は,現実的で多様な3次元ポーズ保存ハンドイメージを合成する学習ベースアプローチを開発した。
論文 参考訳(メタデータ) (2020-10-02T18:27:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。