Fugu-MT 論文翻訳(概要): Hand-Centric Motion Refinement for 3D Hand-Object Interaction via Hierarchical Spatial-Temporal Modeling

論文の概要: Hand-Centric Motion Refinement for 3D Hand-Object Interaction via Hierarchical Spatial-Temporal Modeling

arxiv url: http://arxiv.org/abs/2401.15987v1
Date: Mon, 29 Jan 2024 09:17:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-30 15:42:59.522888
Title: Hand-Centric Motion Refinement for 3D Hand-Object Interaction via Hierarchical Spatial-Temporal Modeling
Title（参考訳）: 階層型空間-テンポラルモデリングによる3次元ハンドオブジェクトインタラクションのための手中心運動の微細化
Authors: Yuze Hao and Jianrong Zhang and Tao Zhuo and Fuan Wen and Hehe Fan
Abstract要約: 粗い手の動き改善のためのデータ駆動方式を提案する。まず,手と物体の動的空間的関係を記述するために,手中心の表現を設計する。第2に,手動物体相互作用の動的手がかりを捉えるために,新しいアーキテクチャを提案する。
参考スコア（独自算出の注目度）: 18.128376292350836
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Hands are the main medium when people interact with the world. Generating proper 3D motion for hand-object interaction is vital for applications such as virtual reality and robotics. Although grasp tracking or object manipulation synthesis can produce coarse hand motion, this kind of motion is inevitably noisy and full of jitter. To address this problem, we propose a data-driven method for coarse motion refinement. First, we design a hand-centric representation to describe the dynamic spatial-temporal relation between hands and objects. Compared to the object-centric representation, our hand-centric representation is straightforward and does not require an ambiguous projection process that converts object-based prediction into hand motion. Second, to capture the dynamic clues of hand-object interaction, we propose a new architecture that models the spatial and temporal structure in a hierarchical manner. Extensive experiments demonstrate that our method outperforms previous methods by a noticeable margin.
Abstract（参考訳）: 人々が世界と対話する主な媒体は手である。バーチャルリアリティやロボティクスなどのアプリケーションでは、手と物体の対話のために適切な3dモーションを生成することが不可欠である。グリップトラッキングやオブジェクト操作合成は粗い手の動きを生じさせるが、このような動きは必然的にうるさく、ジッタだらけである。そこで本研究では,粗い動き改善のためのデータ駆動手法を提案する。まず,手と物体間の動的空間的関係を記述するために手中心表現を設計する。対象中心の表現と比較して、我々の手中心の表現は単純であり、オブジェクトベースの予測を手の動きに変換する曖昧な投影プロセスを必要としない。第2に,手動物体相互作用の動的手がかりを捉えるために,空間構造と時間構造を階層的にモデル化するアーキテクチャを提案する。広範囲にわたる実験により,本手法が従来の手法よりも有意な差を示した。

関連論文リスト

SIGHT: Single-Image Conditioned Generation of Hand Trajectories for Hand-Object Interaction [86.54738165527502]
本研究では,物体の1つの画像に対して,現実的かつ多様な3次元ハンドトラジェクトリを生成する新しいタスクを提案する。手動物体の相互作用の軌跡は、ロボット工学、具体化されたAI、拡張現実、および関連分野の応用に大きな恩恵をもたらす。
論文参考訳（メタデータ） (2025-03-28T20:53:20Z)
Diffgrasp: Whole-Body Grasping Synthesis Guided by Object Motion Using a Diffusion Model [25.00532805042292]
本稿では,身体,手,与えられた物体の動き列の関係をモデル化する,シンプルで効果的な枠組みを提案する。我々は,新たな接触認識損失を導入し,データ駆動型,慎重に設計されたガイダンスを取り入れた。実験の結果,本手法は最先端の手法より優れ,至適な全身運動系列を生成することがわかった。
論文参考訳（メタデータ） (2024-12-30T02:21:43Z)
BimArt: A Unified Approach for the Synthesis of 3D Bimanual Interaction with Articulated Objects [70.20706475051347]
BimArtは3Dバイマニュアルハンドインタラクションを音声オブジェクトと合成するための新しい生成手法である。まず, 物体軌道上に配置された距離ベースの接触マップを, 音声認識特徴表現を用いて生成する。学習された接触は手の動き生成装置のガイドに使われ、物体の動きや調音のための多彩で現実的なバイマニュアルの動きが生成されます。
論文参考訳（メタデータ） (2024-12-06T14:23:56Z)
ManiDext: Hand-Object Manipulation Synthesis via Continuous Correspondence Embeddings and Residual-Guided Diffusion [36.9457697304841]
ManiDextは、手操作やポーズを把握するための階層的な拡散ベースの統合フレームワークである。私たちの重要な洞察は、相互作用中の物体と手との接触関係を正確にモデル化することが重要であるということです。本フレームワークは,まず,物体表面への接触マップと対応埋め込みを生成する。これらの微粒な対応に基づき,拡散過程に反復的精錬プロセスを統合する新しいアプローチを導入する。
論文参考訳（メタデータ） (2024-09-14T04:28:44Z)
EgoGaussian: Dynamic Scene Understanding from Egocentric Video with 3D Gaussian Splatting [95.44545809256473]
エゴガウスアン(EgoGaussian)は、3Dシーンを同時に再構築し、RGBエゴセントリックな入力のみから3Dオブジェクトの動きを動的に追跡する手法である。動的オブジェクトと背景再構築の品質の両面で,最先端技術と比較して大きな改善が見られた。
論文参考訳（メタデータ） (2024-06-28T10:39:36Z)
G-HOP: Generative Hand-Object Prior for Interaction Reconstruction and Grasp Synthesis [57.07638884476174]
G-HOPは手-対象相互作用の前駆体である。人手は骨格距離場を介して表現し、物体の符号付き距離場と整合した表現を得る。この手動物体は、対話クリップからの再構成や人間のつかみ合成など、他の作業を容易にするための汎用的なガイダンスとして機能することを示す。
論文参考訳（メタデータ） (2024-04-18T17:59:28Z)
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions [15.417836855005087]
DiffH2Oは,現実的,一方的あるいは一方的な物体相互作用を合成する新しい手法である。タスクを把握段階とテキストベースのインタラクション段階に分解する。把握段階では、モデルが手の動きのみを生成するのに対し、手と物の両方のポーズが合成される。
論文参考訳（メタデータ） (2024-03-26T16:06:42Z)
Benchmarks and Challenges in Pose Estimation for Egocentric Hand Interactions with Objects [89.95728475983263]
ロボティクス、AR/VR、アクション認識、モーション生成といったタスクにおいて、自己中心的な視点からこのようなインタラクションを理解することが重要である。我々は、AmblyHandsとARCTICデータセットに基づいたHANDS23チャレンジを、慎重に設計されたトレーニングとテストの分割に基づいて設計する。提案手法の結果と近年のリーダーボードのベースラインに基づいて,3Dハンド(オブジェクト)再構成タスクの徹底的な解析を行う。
論文参考訳（メタデータ） (2024-03-25T05:12:21Z)
Controllable Human-Object Interaction Synthesis [77.56877961681462]
本研究では,3次元シーンにおける同期物体の動きと人間の動きを生成するための制御可能な人間-物体相互作用合成(CHOIS)を提案する。ここでは,高レベルな計画から効果的に抽出できるスタイルや意図を言語記述が通知し,シーン内の動きをグラウンド化する。我々のモジュールは経路計画モジュールとシームレスに統合され、3D環境における長期的相互作用の生成を可能にします。
論文参考訳（メタデータ） (2023-12-06T21:14:20Z)
CG-HOI: Contact-Guided 3D Human-Object Interaction Generation [29.3564427724612]
テキストから動的3次元人-物体相互作用(HOI)を生成する最初の方法であるCG-HOIを提案する。意味的に豊かな人間の動きは、しばしば孤立して起こるので、人間と物体の両方の動きを相互依存的にモデル化する。我々は,接触に基づく人間と物体の相互作用が現実的かつ物理的に妥当なシーケンスを生成することを示す。
論文参考訳（メタデータ） (2023-11-27T18:59:10Z)
GRIP: Generating Interaction Poses Using Spatial Cues and Latent Consistency [57.9920824261925]
手は器用で多用途なマニピュレータであり、人間が物体や環境とどのように相互作用するかの中心である。現実的な手オブジェクトの相互作用をモデル化することは、コンピュータグラフィックス、コンピュータビジョン、混合現実の応用において重要である。 GRIPは、体と物体の3次元運動を入力として取り、物体の相互作用の前、中、後の両方の両手の現実的な動きを合成する学習ベースの手法である。
論文参考訳（メタデータ） (2023-08-22T17:59:51Z)
Novel-view Synthesis and Pose Estimation for Hand-Object Interaction from Sparse Views [41.50710846018882]
スパースビューから手動物体間相互作用を推定するニューラルレンダリングとポーズ推定システムを提案する。まず,手や物体の形状や外観を,神経表現と別々に学習する。オンライン段階では、動的手-物体相互作用を理解するためのレンダリングベースのジョイントモデルフィッティングフレームワークを設計する。
論文参考訳（メタデータ） (2023-08-22T05:17:41Z)
Task-Oriented Human-Object Interactions Generation with Implicit Neural Representations [61.659439423703155]
TOHO: 命令型ニューラル表現を用いたタスク指向型ヒューマンオブジェクトインタラクション生成本手法は時間座標のみでパラメータ化される連続運動を生成する。この研究は、一般的なヒューマン・シーンの相互作用シミュレーションに向けて一歩前進する。
論文参考訳（メタデータ） (2023-03-23T09:31:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。