Fugu-MT 論文翻訳(概要): Physics-Aware Human-Object Rendering from Sparse Views via 3D Gaussian Splatting

論文の概要: Physics-Aware Human-Object Rendering from Sparse Views via 3D Gaussian Splatting

arxiv url: http://arxiv.org/abs/2503.09640v1
Date: Wed, 12 Mar 2025 04:19:21 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-17 15:33:20.521113
Title: Physics-Aware Human-Object Rendering from Sparse Views via 3D Gaussian Splatting
Title（参考訳）: 3次元ガウススプレイティングによるスパークビューからの物理認識型ヒューマンオブジェクトレンダリング
Authors: Weiquan Wang, Jun Xiao, Yueting Zhuang, Long Chen,
Abstract要約: HOGSは、スパースビューから効率よく、物理的に妥当なHOIレンダリングのための新しいフレームワークである。 Human Pose RefinementモジュールとSparse-View Human-Object Contact Predictionモジュールが組み込まれている。 HODomeデータセットの実験では、HOGSは既存の方法に比べてレンダリング品質、効率、物理的妥当性が優れていることが示されている。
参考スコア（独自算出の注目度）: 41.369111968498814
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Rendering realistic human-object interactions (HOIs) from sparse-view inputs is challenging due to occlusions and incomplete observations, yet crucial for various real-world applications. Existing methods always struggle with either low rendering qualities (\eg, visual fidelity and physically plausible HOIs) or high computational costs. To address these limitations, we propose HOGS (Human-Object Rendering via 3D Gaussian Splatting), a novel framework for efficient and physically plausible HOI rendering from sparse views. Specifically, HOGS combines 3D Gaussian Splatting with a physics-aware optimization process. It incorporates a Human Pose Refinement module for accurate pose estimation and a Sparse-View Human-Object Contact Prediction module for efficient contact region identification. This combination enables coherent joint rendering of human and object Gaussians while enforcing physically plausible interactions. Extensive experiments on the HODome dataset demonstrate that HOGS achieves superior rendering quality, efficiency, and physical plausibility compared to existing methods. We further show its extensibility to hand-object grasp rendering tasks, presenting its broader applicability to articulated object interactions.
Abstract（参考訳）: スパース・ビュー・インプットからリアルな人間と物体の相互作用(HOI)をレンダリングすることは、隠蔽と不完全な観察のために困難であるが、様々な現実世界の応用には不可欠である。既存の手法は、常に低いレンダリング品質(例えば、視覚的忠実度、物理的に妥当なHOI)または高い計算コストに悩まされる。これらの制約に対処するために,スパークビューから効率よく,物理的に妥当なHOIレンダリングを行う新しいフレームワークであるHOGS(Human-Object Rendering via 3D Gaussian Splatting)を提案する。特に、HOGSは3Dガウススプラッティングと物理を意識した最適化プロセスを組み合わせている。正確なポーズ推定を行うHuman Pose Refinementモジュールと、効率的な接触領域識別を行うSparse-View Human-Object Contact Predictionモジュールが組み込まれている。この組み合わせは、物理的に妥当な相互作用を強制しながら、人間と対象ガウスのコヒーレントな関節レンダリングを可能にする。 HODomeデータセットの大規模な実験により、HOGSは既存の方法よりも優れたレンダリング品質、効率、物理的妥当性を実現することが示された。さらに,手作業によるグリップレンダリングタスクの拡張性を示すとともに,音声による物体の相互作用に広く適用可能であることを示す。

関連論文リスト

Reconstructing Close Human Interaction with Appearance and Proxemics Reasoning [50.76723760768117]
既存の人間のポーズ推定手法では、既存の映像からもっともらしい密接な相互作用を回復できない。人間の外見は、これらの障害に対処するための簡単な手がかりとなる。本研究では,人間の外見,社会的プロキシ,物理法則に制約された身体接触により,正確な対話動作を再構築するための2分岐最適化フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-03T12:19:26Z)
PIG: Physically-based Multi-Material Interaction with 3D Gaussians [14.097146027458368]
PIG: 3次元ガウシアンとの物理的に基いた多元的相互作用は、3次元物体のセグメンテーションと高精度に相互作用する物体のシミュレーションを組み合わせた新しいアプローチである。本手法は,映像品質の面では最先端技術(SOTA)よりも優れるだけでなく,物理的に現実的なシーン生成の分野での新たな方向やパイプラインも開放することを示す。
論文参考訳（メタデータ） (2025-06-09T11:25:21Z)
Parametric Gaussian Human Model: Generalizable Prior for Efficient and Realistic Human Avatar Modeling [32.480049588166544]
フォトとアニマタブルな人間のアバターは、バーチャル/拡張現実、テレプレゼンス、デジタルエンターテイメントの鍵となる。本稿では,人間を3DGSに統合する汎用的で効率的なフレームワークであるParametric Gaussian Human Model(PGHM)を提案する。実験の結果、PGHMは最適化からスクラッチまでの手法よりもはるかに効率が良く、1被写体あたり約20分で同等の視覚的品質のアバターを生産できることがわかった。
論文参考訳（メタデータ） (2025-06-07T03:53:30Z)
Zero-Shot Human-Object Interaction Synthesis with Multimodal Priors [31.277540988829976]
本稿では,現在限定されている3次元HOIデータセットのエンドツーエンドトレーニングに頼ることなく,新しいゼロショットHOI合成フレームワークを提案する。我々は、事前訓練された人間のポーズ推定モデルを用いて、人間のポーズを抽出し、一般化可能なカテゴリレベルの6-DoF推定手法を導入し、2次元HOI画像からオブジェクトポーズを求める。
論文参考訳（メタデータ） (2025-03-25T23:55:47Z)
StackFLOW: Monocular Human-Object Reconstruction by Stacked Normalizing Flow with Offset [56.71580976007712]
本研究では,人間のメッシュと物体メッシュの表面から密にサンプリングされたアンカー間の人物体オフセットを用いて,人物体空間関係を表現することを提案する。この表現に基づいて、画像から人・物間の空間関係の後方分布を推定するスタック正規化フロー(StackFLOW)を提案する。最適化段階では、サンプルの可能性を最大化することにより、人体ポーズと物体6Dポーズを微調整する。
論文参考訳（メタデータ） (2024-07-30T04:57:21Z)
Human-Aware 3D Scene Generation with Spatially-constrained Diffusion Models [16.259040755335885]
従来の自己回帰に基づく3Dシーン生成手法は、複数の物体と入力人間の関節分布を正確に捉えるのに苦労してきた。本研究では,人間-物体衝突回避機構とオブジェクト-部屋境界制約という2つの空間衝突誘導機構を導入する。我々のフレームワークは、人間とシーンのインタラクションを正確に行うことで、より自然でわかりやすい3Dシーンを生成することができる。
論文参考訳（メタデータ） (2024-06-26T08:18:39Z)
HUGS: Holistic Urban 3D Scene Understanding via Gaussian Splatting [53.6394928681237]
RGB画像に基づく都市景観の全体的理解は、難しいが重要な問題である。我々の主な考え方は、静的な3Dガウスと動的なガウスの組合せを用いた幾何学、外観、意味論、運動の合同最適化である。提案手法は,2次元および3次元のセマンティック情報を高精度に生成し,新たな視点をリアルタイムに描画する機能を提供する。
論文参考訳（メタデータ） (2024-03-19T13:39:05Z)
Scaling Up Dynamic Human-Scene Interaction Modeling [58.032368564071895]
TRUMANSは、現在利用可能な最も包括的なモーションキャプチャーHSIデータセットである。人体全体の動きや部分レベルの物体の動きを複雑に捉えます。本研究では,任意の長さのHSI配列を効率的に生成する拡散型自己回帰モデルを提案する。
論文参考訳（メタデータ） (2024-03-13T15:45:04Z)
Beyond the Contact: Discovering Comprehensive Affordance for 3D Objects from Pre-trained 2D Diffusion Models [8.933560282929726]
我々はComprehensive Affordance(ComA)という新しい余裕表現を導入する。 3Dオブジェクトメッシュが与えられたとき、ComAは相互作用する人間のメッシュにおける相対配向と頂点の近接の分布をモデル化する。 ComAは、連絡先ベースの価格のモデリングにおいて、人間のアノテーションに依存している競争相手よりも優れていることを実証する。
論文参考訳（メタデータ） (2024-01-23T18:59:59Z)
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting [113.37908093915837]
既存の方法は、スコア蒸留サンプリング(SDS)を通じてメッシュやニューラルフィールドのような3D表現を最適化する。本稿では,高精細な形状とリアルな外観を持つ高品質な3D人間を創出する,効率的かつ効果的な枠組みであるHumanGaussianを提案する。
論文参考訳（メタデータ） (2023-11-28T18:59:58Z)
NeuralFusion: Neural Volumetric Rendering under Human-object Interactions [46.70371238621842]
本稿では,スパース・コンシューマRGBDセンサを用いたボリューム・オブジェクトのキャプチャとレンダリングのためのニューラル・アプローチを提案する。幾何学的モデリングでは,非剛性鍵体積融合を用いたニューラル暗黙的推論方式を提案する。また,空間的領域と時間的領域の両方において,ボリュームと画像に基づくレンダリングを組み合わせた階層的ヒューマンオブジェクトテクスチャレンダリング手法を提案する。
論文参考訳（メタデータ） (2022-02-25T17:10:07Z)
HSPACE: Synthetic Parametric Humans Animated in Complex Environments [67.8628917474705]
我々は、複雑な屋内および屋外環境に置かれたアニメーション人間による大規模な写真リアルデータセット、Human-SPACEを構築した。年齢、性別、比率、民族性の異なる数百の個人と数百の動きとシーンを組み合わせて、100万フレームを超える最初のデータセットを生成します。アセットは大規模に自動生成され、既存のリアルタイムレンダリングやゲームエンジンと互換性がある。
論文参考訳（メタデータ） (2021-12-23T22:27:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。