論文の概要: PhyGenHOI: Physically-Aware 4D Generation of Dynamic Human-Object Interactions
- arxiv url: http://arxiv.org/abs/2605.30268v1
- Date: Thu, 28 May 2026 17:29:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.585985
- Title: PhyGenHOI: Physically-Aware 4D Generation of Dynamic Human-Object Interactions
- Title(参考訳): PhyGenhoi:動的人間と物体の相互作用を物理的に認識する4次元生成
- Authors: Omer Benishu, Gal Fiebelman, Sagie Benaim,
- Abstract要約: 我々は、生成的人間の動きと明示的な物理的物体シミュレーションを結合するフレームワークであるPhyGenHOIを紹介する。
PhyGenHOIは、さまざまなアクション、人間、オブジェクトに対して物理的に一貫した4D HOIを生成し、ベースラインを上回ります。
- 参考スコア(独自算出の注目度): 9.803936920993705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the task of generating physically accurate and visually faithful 4D Human-Object Interaction (HOI). Given a static 3D human and target object represented as 3D Gaussian Splats (3DGS), our goal is to synthesize dynamic scenes where the human actively engages with the object through actions, such as punching or kicking, in accordance with a given input text. To this end, we introduce PhyGenHOI, a novel framework that couples generative human motion with an explicit physical object simulation. We model the human as a semantic agent driven by a Motion Diffusion Model (MDM) and the object as a physical agent simulated via the Material Point Method (MPM), utilizing 3D Gaussians as a unified, differentiable representation. We supervise their interaction through three coupled mechanisms: (1) A Windowed Attraction Loss that temporally synchronizes generative motion to intercept the object; (2) A Contact-Driven Re-simulation step that triggers physically consistent momentum transfer upon impact; and (3) A Masked Video-SDS objective that injects video-based priors to enhance contact fidelity. Experiments show PhyGenHOI generates physically consistent 4D HOI across diverse actions, humans, and objects, outperforming baselines. Project page and videos: https://omerbenishu.github.io/PhyGenHOI/
- Abstract(参考訳): 身体的正確で視覚的に忠実な4Dヒューマンオブジェクトインタラクション(HOI)を創出する課題に対処する。
静的な3次元人物と対象物体が3Dガウススプラッター(3DGS)として表現されることで、与えられた入力テキストに従って、人間がパンチや蹴りなどの動作を通じてオブジェクトと活発に関わり合う動的なシーンを合成することが目的である。
この目的のために,生成的人間の動作と明示的な物理的物体シミュレーションを結合する新しいフレームワークであるPhyGenHOIを紹介する。
我々は,運動拡散モデル(MDM)によって駆動される意味エージェントとして人間をモデル化し,物質点法(MPM)でシミュレートされた物理エージェントとしてオブジェクトをモデル化し,3次元ガウスを統一的,微分可能な表現として利用した。
1)物体をインターセプトするための生成運動を時間的に同期させるウィンドウド・アトラクション・ロス、(2)衝撃に対する物理的に一貫した運動量移動を誘発するコンタクト駆動リシミュレーション・ステップ、(3)接触忠実度を高めるためにビデオベース先行を注入するマスケッド・ビデオ-SDS目標である。
PhyGenHOIは、さまざまなアクション、人間、オブジェクトに対して物理的に一貫した4D HOIを生成し、ベースラインを上回ります。
プロジェクトページとビデオ:https://omerbenishu.github.io/PhyGenHOI/
関連論文リスト
- Real2Sim in HOI: Toward Physically Plausible HOI Reconstruction from Monocular Videos [26.750787853601413]
HOI再建は、人間と物体の追跡に止まるのではなく、動きをコヒーレントな相互作用にする関係を回復すべきである。
我々は,4D HOIアニメーションを室内モノクロビデオから再構成するためのフレームワークである$textbfHA-HOI$を紹介した。
我々の研究は、一般的なモノクラーHOIビデオを、ヒューマノイドオブジェクトの動作のためのスケーラブルなデモに変換するための一歩を踏み出した。
論文 参考訳(メタデータ) (2026-05-14T06:56:57Z) - VHOI: Controllable Video Generation of Human-Object Interactions from Sparse Trajectories via Motion Densification [65.15340059997273]
VHOIは、ビデオにおける現実的な人間とオブジェクトの相互作用を作成するためのフレームワークである。
そこで本研究では,人体と物体の運動だけでなく,身体部分特異的な動特性も識別するために,色エンコーディングを用いた新しいHOI対応動作表現を提案する。
実験は、制御可能なHOIビデオ生成における最先端の結果を示す。
論文 参考訳(メタデータ) (2025-12-10T13:40:24Z) - CoopDiff: Anticipating 3D Human-object Interactions via Contact-consistent Decoupled Diffusion [62.93198247045824]
3Dヒューマンオブジェクトインタラクション(HOI)は,人間の将来の動きとその操作対象を,歴史的文脈で予測することを目的としている。
そこで我々は,人間と物体の運動モデリングを分離するために,2つの異なる分岐を用いた接触非結合拡散フレームワークCoopDiffを提案する。
論文 参考訳(メタデータ) (2025-08-10T03:29:17Z) - DAViD: Modeling Dynamic Affordance of 3D Objects Using Pre-trained Video Diffusion Models [9.103840202072336]
本稿では,様々な対象対象カテゴリにまたがって動的アフォーダンスを学習するための新しいフレームワークを提案する。
4D HOIデータセットの不足に対処するために, 合成した4D HOIサンプルから3次元ダイナミックアベイランスを学習する。
生成的4次元物体相互作用モデルであるDAViDがHOI動作のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2025-01-14T18:59:59Z) - EgoGaussian: Dynamic Scene Understanding from Egocentric Video with 3D Gaussian Splatting [95.44545809256473]
エゴガウスアン(EgoGaussian)は、3Dシーンを同時に再構築し、RGBエゴセントリックな入力のみから3Dオブジェクトの動きを動的に追跡する手法である。
動的オブジェクトと背景再構築の品質の両面で,最先端技術と比較して大きな改善が見られた。
論文 参考訳(メタデータ) (2024-06-28T10:39:36Z) - Task-Oriented Human-Object Interactions Generation with Implicit Neural
Representations [61.659439423703155]
TOHO: 命令型ニューラル表現を用いたタスク指向型ヒューマンオブジェクトインタラクション生成
本手法は時間座標のみでパラメータ化される連続運動を生成する。
この研究は、一般的なヒューマン・シーンの相互作用シミュレーションに向けて一歩前進する。
論文 参考訳(メタデータ) (2023-03-23T09:31:56Z) - Estimating 3D Motion and Forces of Human-Object Interactions from
Internet Videos [49.52070710518688]
一つのRGBビデオからオブジェクトと対話する人の3D動作を再構築する手法を提案する。
本手法では,被験者の3次元ポーズを物体のポーズ,接触位置,人体の接触力とともに推定する。
論文 参考訳(メタデータ) (2021-11-02T13:40:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。