論文の概要: THOM: Generating Physically Plausible Hand-Object Meshes From Text
- arxiv url: http://arxiv.org/abs/2604.02736v1
- Date: Fri, 03 Apr 2026 05:17:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.328473
- Title: THOM: Generating Physically Plausible Hand-Object Meshes From Text
- Title(参考訳): THOM:テキストから物理的に可塑性のハンドオブジェクトメッシュを生成する
- Authors: Uyoung Jeong, Yihalem Yimolal Tiruneh, Hyung Jin Chang, Seungryul Baek, Kwang In Kim,
- Abstract要約: テキストからの3Dハンドオブジェクトインタラクション(HOIs)の生成は,ロボットの器用な把握とVR/ARコンテンツ生成に不可欠である。
我々は、テンプレートオブジェクトメッシュを必要とせずに、フォトリアリスティックで物理的に可視な3D HOIメッシュを生成する、トレーニング不要のフレームワークであるTHOMを紹介した。
THOMは、テキストアライメント、視覚リアリズム、相互作用の可視性の観点から、最先端の手法を一貫して超越している。
- 参考スコア(独自算出の注目度): 44.69476210110844
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The generation of 3D hand-object interactions (HOIs) from text is crucial for dexterous robotic grasping and VR/AR content generation, requiring both high visual fidelity and physical plausibility. Nevertheless, the ill-posed problem of mesh extraction from text-generated Gaussians, and physics-based optimization on the erroneous meshes pose challenges. To address these issues, we introduce THOM, a training-free framework that generates photorealistic, physically plausible 3D HOI meshes without the need for a template object mesh. THOM employs a two-stage pipeline, initially generating the hand and object Gaussians, followed by physics-based HOI optimization. Our new mesh extraction method and vertex-to-Gaussian mapping explicitly assign Gaussian elements to mesh vertices, allowing topology-aware regularization. Furthermore, we improve the physical plausibility of interactions by VLM-guided translation refinement and contact-aware optimization. Comprehensive experiments demonstrate that THOM consistently surpasses state-of-the-art methods in terms of text alignment, visual realism, and interaction plausibility.
- Abstract(参考訳): テキストからの3Dハンドオブジェクトインタラクション(HOIs)の生成は、視覚的忠実度と身体的妥当性の両方を必要とする、器用なロボットの把握とVR/ARコンテンツ生成に不可欠である。
それでも、テキスト生成ガウスからのメッシュ抽出の誤った問題や、誤ったメッシュ上での物理に基づく最適化が課題となっている。
これらの問題に対処するために、テンプレートオブジェクトメッシュを必要とせずに、フォトリアリスティックで物理的に可視な3D HOIメッシュを生成する、トレーニング不要のフレームワークであるTHOMを紹介した。
THOMは2段階のパイプラインを使用し、最初は手とオブジェクトのガウシアンを生成し、続いて物理ベースのHOI最適化を行う。
我々の新しいメッシュ抽出法と頂点-ガウス写像は、明示的にガウス要素をメッシュ頂点に割り当て、トポロジ対応の正規化を可能にする。
さらに,VLM誘導翻訳の改良と接触認識最適化により,インタラクションの物理的妥当性を向上させる。
総合的な実験により、THOMはテキストアライメント、視覚リアリズム、相互作用の可視性の観点から、最先端の手法を一貫して超越していることが示された。
関連論文リスト
- Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding [50.098085774845195]
本稿では,大規模生成モデルにおいて暗黙の空間的先行性を活用することで,パラダイムシフトを提案する。
GeneEGA-3D (Video Extracted Generative Awareness) は,事前学習した映像拡散モデルを潜在世界シミュレータとして再利用するプラグイン・アンド・プレイ・フレームワークである。
論文 参考訳(メタデータ) (2026-03-19T17:59:58Z) - High-Fidelity 3D Facial Avatar Synthesis with Controllable Fine-Grained Expressions [83.73866089033585]
本稿では,テクスチャ編集のための事前学習型3D-Aware GANモデルの潜在コードとメッシュ編集のための駆動型3DMMモデルの表現コードの両方を同時に精製して,新しいアプローチを提案する。
デュアルマッパーを最適化するために,CLIPをベースとした目的関数をターゲットとするテキスト誘導最適化手法を提案する。
論文 参考訳(メタデータ) (2026-03-16T03:25:10Z) - GS-Verse: Mesh-based Gaussian Splatting for Physics-aware Interaction in Virtual Reality [1.2271175670122132]
バーチャルリアリティ(VR)内の3Dコンテンツを物理的に操作する現在の技術は、しばしば重大な制限に直面している。
GS-Verseは、オブジェクトのメッシュをガウススプティング表現と直接統合することで、これらの課題を克服する新しい手法である。
私たちのシステムは物理工学に依存しないように設計されており、開発者に堅牢なデプロイメントの柔軟性を与えます。
論文 参考訳(メタデータ) (2025-10-13T19:36:47Z) - PIG: Physically-based Multi-Material Interaction with 3D Gaussians [14.097146027458368]
PIG: 3次元ガウシアンとの物理的に基いた多元的相互作用は、3次元物体のセグメンテーションと高精度に相互作用する物体のシミュレーションを組み合わせた新しいアプローチである。
本手法は,映像品質の面では最先端技術(SOTA)よりも優れるだけでなく,物理的に現実的なシーン生成の分野での新たな方向やパイプラインも開放することを示す。
論文 参考訳(メタデータ) (2025-06-09T11:25:21Z) - SIGHT: Synthesizing Image-Text Conditioned and Geometry-Guided 3D Hand-Object Trajectories [124.24041272390954]
手動物体の相互作用をモデル化することは、ロボットと具体化されたAIシステムを前進させる大きな可能性を秘めている。
SIGHTは、1つの画像から現実的で物理的に妥当な3Dハンドオブジェクトインタラクショントラジェクトリを生成することに焦点を当てた,新しいタスクである。
SIGHT-Fusionは,データベースから最もよく似た3Dオブジェクトメッシュを抽出し,この課題に対処する,新しい拡散型画像文条件付き生成モデルを提案する。
論文 参考訳(メタデータ) (2025-03-28T20:53:20Z) - DreamMesh4D: Video-to-4D Generation with Sparse-Controlled Gaussian-Mesh Hybrid Representation [10.250715657201363]
本稿では,メッシュ表現と幾何スキン技術を組み合わせた新しいフレームワークDreamMesh4Dを紹介し,モノクロビデオから高品質な4Dオブジェクトを生成する。
我々の手法は現代のグラフィックパイプラインと互換性があり、3Dゲームや映画産業におけるその可能性を示している。
論文 参考訳(メタデータ) (2024-10-09T10:41:08Z) - GIC: Gaussian-Informed Continuum for Physical Property Identification and Simulation [60.33467489955188]
本稿では,視覚的観察を通して物理特性(システム同定)を推定する問題について検討する。
物理特性推定における幾何学的ガイダンスを容易にするために,我々は新しいハイブリッドフレームワークを提案する。
本研究では,3次元ガウス点集合としてオブジェクトを復元する動き分解に基づく動的3次元ガウスフレームワークを提案する。
抽出された物体表面に加えて、ガウスインフォームド連続体はシミュレーション中の物体マスクのレンダリングを可能にする。
論文 参考訳(メタデータ) (2024-06-21T07:37:17Z) - MaGS: Reconstructing and Simulating Dynamic 3D Objects with Mesh-adsorbed Gaussian Splatting [27.081250446161114]
本稿では,この課題に対処するために,メッシュ吸着型ガウス平滑化法(MaGS)を提案する。
MaGSは、3Dガウス人がメッシュの近くで歩き回ることを制約し、相互に吸着されたメッシュ-ガウスの3D表現を生成する。
このような表現は、3Dガウスのレンダリングの柔軟性とメッシュの構造的特性の両方を利用する。
論文 参考訳(メタデータ) (2024-06-03T17:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。