論文の概要: ScoreHOI: Physically Plausible Reconstruction of Human-Object Interaction via Score-Guided Diffusion
- arxiv url: http://arxiv.org/abs/2509.07920v1
- Date: Tue, 09 Sep 2025 17:00:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.40696
- Title: ScoreHOI: Physically Plausible Reconstruction of Human-Object Interaction via Score-Guided Diffusion
- Title(参考訳): Scorehoi: スコアガイド拡散による人間と物体の相互作用の物理的にプラザブルな再構築
- Authors: Ao Li, Jinpeng Liu, Yixuan Zhu, Yansong Tang,
- Abstract要約: ScoreHOIは,ヒトと物体の相互作用再構築に有効な拡散モデルである。
推測中、ScoreHOIは特定の物理的制約で認知過程を誘導することにより、再建結果を効果的に改善する。
本稿では,接触可視性を向上し,再現精度を向上させるために,接触駆動型反復改善手法を提案する。
- 参考スコア(独自算出の注目度): 40.82318436286586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Joint reconstruction of human-object interaction marks a significant milestone in comprehending the intricate interrelations between humans and their surrounding environment. Nevertheless, previous optimization methods often struggle to achieve physically plausible reconstruction results due to the lack of prior knowledge about human-object interactions. In this paper, we introduce ScoreHOI, an effective diffusion-based optimizer that introduces diffusion priors for the precise recovery of human-object interactions. By harnessing the controllability within score-guided sampling, the diffusion model can reconstruct a conditional distribution of human and object pose given the image observation and object feature. During inference, the ScoreHOI effectively improves the reconstruction results by guiding the denoising process with specific physical constraints. Furthermore, we propose a contact-driven iterative refinement approach to enhance the contact plausibility and improve the reconstruction accuracy. Extensive evaluations on standard benchmarks demonstrate ScoreHOI's superior performance over state-of-the-art methods, highlighting its ability to achieve a precise and robust improvement in joint human-object interaction reconstruction.
- Abstract(参考訳): 人間と物体の相互作用を共同で再構築することは、人間と周囲の環境の間の複雑な相互関係を理解する上で重要なマイルストーンとなる。
しかしながら、従来の最適化手法は、人間と物体の相互作用に関する事前知識が欠如しているため、物理的に妥当な再構築結果を達成するのに苦労することが多い。
本稿では,人間と物体の相互作用を正確に再現するための拡散先行処理を導入する,効果的な拡散に基づく最適化手法であるScoreHOIを紹介する。
スコア誘導サンプリングにおける制御性を活用することにより、拡散モデルは、画像観察とオブジェクトの特徴を考慮し、人間とオブジェクトの条件分布を再構成することができる。
推測中、ScoreHOIは特定の物理的制約で認知過程を誘導することにより、再建結果を効果的に改善する。
さらに,接触可視性を向上し,再現精度を向上させるために,接触駆動反復改善手法を提案する。
標準ベンチマークに対する広範囲な評価は、ScoreHOIが最先端の手法よりも優れた性能を示し、ヒトとオブジェクトの相互作用の再構築において正確で堅牢な改善を実現する能力を強調している。
関連論文リスト
- ECHO: Ego-Centric modeling of Human-Object interactions [71.17118015822699]
ECHO (Ego-Centric Modeling of Human-Object Interaction) を開発した。
人間のポーズ、物体の動き、そしてそのような最小限の観察から接触の3つのモダリティを回復する。
同じ柔軟性を提供しない既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-08-29T12:12:22Z) - Reconstructing Close Human Interaction with Appearance and Proxemics Reasoning [50.76723760768117]
既存の人間のポーズ推定手法では、既存の映像からもっともらしい密接な相互作用を回復できない。
人間の外見は、これらの障害に対処するための簡単な手がかりとなる。
本研究では,人間の外見,社会的プロキシ,物理法則に制約された身体接触により,正確な対話動作を再構築するための2分岐最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-03T12:19:26Z) - Learning to Align and Refine: A Foundation-to-Diffusion Framework for Occlusion-Robust Two-Hand Reconstruction [50.952228546326516]
単眼画像からの両手再建は、複雑でダイナミックな手の位置が原因で、永続的な課題に直面している。
既存のアプローチはそのようなアライメントの問題に悩まされ、しばしば不整合と侵入の成果物をもたらす。
本稿では,視覚基礎モデルからの2次元事前ガイダンスを正確に整合させる2段階のファンデーション・ツー・ディフュージョンフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-22T14:42:27Z) - Occluded Human Pose Estimation based on Limb Joint Augmentation [14.36131862057872]
そこで本研究では,人体におけるポーズ推定モデルの一般化能力を高めるために,手足関節拡張に基づく閉鎖型ポーズ推定フレームワークを提案する。
モデルの局所化能力を高めるために,手足グラフに基づく動的構造損失関数を構築し,閉塞した関節の分布を探索する。
論文 参考訳(メタデータ) (2024-10-13T15:48:24Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - Forget-me-not! Contrastive Critics for Mitigating Posterior Collapse [20.258298183228824]
我々は,潜伏変数と観測値の対応を必要とする事で,後部崩壊を検知し,インセンティブを与える推論評論家を紹介した。
このアプローチは実装が簡単で、事前のメソッドよりもトレーニング時間が大幅に少なくなります。
論文 参考訳(メタデータ) (2022-07-19T20:07:17Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - RobustFusion: Robust Volumetric Performance Reconstruction under
Human-object Interactions from Monocular RGBD Stream [27.600873320989276]
現実のシナリオでは、さまざまなオブジェクトと複雑な相互作用を持つ人間のパフォーマンスの高品質の4D再構築が不可欠です。
近年の進歩は、信頼性の高い性能回復には至っていない。
人間と物体のインタラクションシナリオのための堅牢なボリュームパフォーマンス再構築システムであるRobustFusionを提案する。
論文 参考訳(メタデータ) (2021-04-30T08:41:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。