論文の概要: Towards Realistic Hand-Object Interaction with Gravity-Field Based Diffusion Bridge
- arxiv url: http://arxiv.org/abs/2509.03114v1
- Date: Wed, 03 Sep 2025 08:15:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.456641
- Title: Towards Realistic Hand-Object Interaction with Gravity-Field Based Diffusion Bridge
- Title(参考訳): 重力場に基づく拡散橋による実物間相互作用の実現に向けて
- Authors: Miao Xu, Xiangyu Zhu, Xusheng Liang, Zidu Wang, Jinlin Wu, Zhen Lei,
- Abstract要約: 本研究では,手・物体の相互作用をアトラクション駆動のプロセスとして定式化し,変形可能な手表面と剛体物体との相互作用をシミュレートする重力場ベース拡散橋(GravityDB)を提案する。
本手法は, 干渉のない物理的に妥当な相互作用を生成し, 安定した把握を確保し, 現実的な手の動きを捉えることによって, 上記の課題を効果的に解決する。
- 参考スコア(独自算出の注目度): 23.484478357333856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing reconstruction or hand-object pose estimation methods are capable of producing coarse interaction states. However, due to the complex and diverse geometry of both human hands and objects, these approaches often suffer from interpenetration or leave noticeable gaps in regions that are supposed to be in contact. Moreover, the surface of a real human hand undergoes non-negligible deformations during interaction, which are difficult to capture and represent with previous methods. To tackle these challenges, we formulate hand-object interaction as an attraction-driven process and propose a Gravity-Field Based Diffusion Bridge (GravityDB) to simulate interactions between a deformable hand surface and rigid objects. Our approach effectively resolves the aforementioned issues by generating physically plausible interactions that are free of interpenetration, ensure stable grasping, and capture realistic hand deformations. Furthermore, we incorporate semantic information from textual descriptions to guide the construction of the gravitational field, enabling more semantically meaningful interaction regions. Extensive qualitative and quantitative experiments on multiple datasets demonstrate the effectiveness of our method.
- Abstract(参考訳): 既存の再構成や手動ポーズ推定方法は、粗い相互作用状態を生成することができる。
しかしながら、人手と物体の複雑な多様形状のため、これらのアプローチは、しばしば、接触していると考えられる領域において、相互接続や顕著なギャップを埋めることに悩まされる。
さらに、実際の人間の手の表面は相互作用中に非無視的な変形を受けており、これは以前の方法で捕獲し表現することが困難である。
これらの課題に対処するため、我々はアトラクション駆動のプロセスとしてハンドオブジェクト間相互作用を定式化し、変形可能な手表面と剛体物体との相互作用をシミュレートする重力場ベース拡散橋(GravityDB)を提案する。
本手法は, 干渉のない物理的に妥当な相互作用を生成し, 安定した把握を確保し, 現実的な手の動きを捉えることによって, 上記の課題を効果的に解決する。
さらに、テキスト記述からの意味情報を組み込んで、重力場の構築を導くことにより、より意味論的に意味のある相互作用領域を可能にする。
複数のデータセットに対する大規模定性的および定量的実験により,本手法の有効性が示された。
関連論文リスト
- Learning to Align and Refine: A Foundation-to-Diffusion Framework for Occlusion-Robust Two-Hand Reconstruction [50.952228546326516]
単眼画像からの両手再建は、複雑でダイナミックな手の位置が原因で、永続的な課題に直面している。
既存のアプローチはそのようなアライメントの問題に悩まされ、しばしば不整合と侵入の成果物をもたらす。
本稿では,視覚基礎モデルからの2次元事前ガイダンスを正確に整合させる2段階のファンデーション・ツー・ディフュージョンフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-22T14:42:27Z) - OOD-HOI: Text-Driven 3D Whole-Body Human-Object Interactions Generation Beyond Training Domains [66.62502882481373]
現在の方法では、身体と手の両方に焦点を合わせ、結束的で現実的な相互作用を生み出す能力を制限する傾向にある。
我々は,OOD-HOIというテキスト駆動型フレームワークを提案する。
提案手法は,初期相互作用ポーズを合成するための二重分岐相互拡散モデルと,予測された接触領域に基づく物理的精度向上のための接触誘導相互作用精製器と,ロバスト性向上のための意味的調整と変形を含む動的適応機構を統合した。
論文 参考訳(メタデータ) (2024-11-27T10:13:35Z) - Dynamic Reconstruction of Hand-Object Interaction with Distributed Force-aware Contact Representation [47.940270914254285]
ViTaM-Dは、動的手・物体の相互作用を分散触覚で再構築するための視覚触覚フレームワークである。
DF-Fieldは手動物体相互作用における運動エネルギーとポテンシャルエネルギーを利用する力覚接触表現である。
ViTaM-Dは、剛性および変形性の両方のオブジェクトの復元精度において、最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-11-14T16:29:45Z) - ManiDext: Hand-Object Manipulation Synthesis via Continuous Correspondence Embeddings and Residual-Guided Diffusion [36.9457697304841]
ManiDextは、手操作やポーズを把握するための階層的な拡散ベースの統合フレームワークである。
私たちの重要な洞察は、相互作用中の物体と手との接触関係を正確にモデル化することが重要であるということです。
本フレームワークは,まず,物体表面への接触マップと対応埋め込みを生成する。
これらの微粒な対応に基づき,拡散過程に反復的精錬プロセスを統合する新しいアプローチを導入する。
論文 参考訳(メタデータ) (2024-09-14T04:28:44Z) - DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions [15.417836855005087]
DiffH2Oとよばれる新しい手法を提案する。
本手法では,限られたデータから効果的な学習を可能にする3つの手法を導入する。
論文 参考訳(メタデータ) (2024-03-26T16:06:42Z) - Gaze-guided Hand-Object Interaction Synthesis: Dataset and Method [61.19028558470065]
本稿では,視線,手,物間相互作用の3次元モデリングを同時に行う最初のデータセットであるGazeHOIを紹介する。
これらの課題に対処するため,GHO-Diffusion という手動物体間相互作用拡散モデルを提案する。
また, GHO拡散のサンプリング段階におけるHOI-Manifold Guidanceを導入し, 生成した動きのきめ細かい制御を可能にする。
論文 参考訳(メタデータ) (2024-03-24T14:24:13Z) - THOR: Text to Human-Object Interaction Diffusion via Relation Intervention [51.02435289160616]
我々は、リレーショナルインターベンション(THOR)を用いたテキスト誘導型ヒューマンオブジェクト相互作用拡散モデルを提案する。
各拡散段階において、テキスト誘導された人間と物体の動きを開始し、その後、人と物体の関係を利用して物体の動きに介入する。
テキスト記述をシームレスに統合するText2HOIデータセットであるText-BEHAVEを,現在最大規模で公開されている3D HOIデータセットに構築する。
論文 参考訳(メタデータ) (2024-03-17T13:17:25Z) - Pairwise-Constrained Implicit Functions for 3D Human Heart Modelling [60.56741715207466]
我々は、心を相互依存型SDFの集合としてモデル化するペアワイズ拘束型SDFアプローチを導入する。
本手法は, 単SDF, UDF, ボクセルベース, セグメンテーションベースを用いて, 内部構造精度を大幅に向上させる。
論文 参考訳(メタデータ) (2023-07-16T10:07:15Z) - HMDO: Markerless Multi-view Hand Manipulation Capture with Deformable
Objects [8.711239906965893]
HMDOは、手と変形可能な物体の対話的な動きを記録する最初のマーカーレス変形可能な相互作用データセットである。
提案手法は,手と変形可能な物体の対話的動きを高品質に再現することができる。
論文 参考訳(メタデータ) (2023-01-18T16:55:15Z) - Physical Interaction: Reconstructing Hand-object Interactions with
Physics [17.90852804328213]
本稿では, 復元のあいまいさを解消する物理に基づく手法を提案する。
まず、手動物体の力に基づく動的モデルを提案し、これは観測されていない接触を回復し、また可塑性接触力の解法である。
実験により,提案手法は物理的に可塑性とより正確な手-物体相互作用の両方を再構成することを示した。
論文 参考訳(メタデータ) (2022-09-22T07:41:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。