論文の概要: CP4D: Compositional Physics-aware 4D Scene Generation
- arxiv url: http://arxiv.org/abs/2606.09187v1
- Date: Mon, 08 Jun 2026 08:23:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.830791
- Title: CP4D: Compositional Physics-aware 4D Scene Generation
- Title(参考訳): CP4D: 物理を意識した4Dシーン生成
- Authors: Hanxin Zhu, Cong Wang, Tianyu He, Long Chen, Xin Jin, Chen Gao, Zhibo Chen,
- Abstract要約: 複雑な物理力学に忠実に固執した4次元シーン合成のための新しいパラダイムであるCP4Dを提案する。
CP4Dは探索可能なインタラクティブな4Dシーンを生成できることを示す。
- 参考スコア(独自算出の注目度): 37.130324925592795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 4D generation (\textit{i.e.}, dynamic 3D generation) has recently emerged as a rapidly growing research frontier due to its powerful spatiotemporal modeling capabilities. However, despite notable advances, existing approaches typically fail to capture the underlying physical principles, producing results that are both physically inconsistent and visually implausible. To overcome this limitation, we present CP4D, a novel paradigm for photorealistic 4D scene synthesis with faithful adherence to complex physical dynamics. Drawing inspiration from the compositional nature of real-world scenes, where immutable static backgrounds coexist with dynamic, physically plausible foregrounds, CP4D reformulates 4D generation as the integration of a static 3D environment with physically grounded dynamic objects. On this basis, our framework follows a three-stage pipeline: \textbf{1)} Firstly, we leverage pre-trained expert models to generate high-fidelity 3D representations of the environment and foreground objects respectively. \textbf{2)} Subsequently, to produce physically plausible trajectories and realistic interactions for these objects, we propose a hybrid motion synthesis strategy that integrates priors from physical simulators with the common sense embedded in video diffusion models. \textbf{3)} Finally, we develop an automated composition mechanism that seamlessly fuses the static environment and dynamic objects into coherent, physically consistent 4D scenes. Extensive experiments demonstrate that CP4D can generate explorable and interactive 4D scenes with high visual fidelity, strong physical plausibility, and fine-grained controllability, significantly outperforming existing methods. The project page: https://anonymous.4open.science/w/CP4D/.
- Abstract(参考訳): 4D生成(\textit{i.e.}、動的3D生成)は、その強力な時空間モデリング能力のために、最近急速に成長する研究フロンティアとして現れている。
しかし、顕著な進歩にもかかわらず、既存のアプローチは通常、基礎となる物理原理を捉えず、物理的に一貫性がなく、視覚的にも理解できない結果を生み出す。
この制限を克服するために、複雑な物理力学に忠実に固執する光現実性4Dシーン合成のための新しいパラダイムであるCP4Dを提案する。
イミュータブルな静的背景と動的にプラウザブルなフォアグラウンドが共存する現実世界のシーンの構成的性質からインスピレーションを得たCP4Dは、静的な3D環境と物理的に接地された動的オブジェクトの統合として4D生成を再構成する。
第一に、トレーニング済みのエキスパートモデルを利用して、環境と前景オブジェクトの高忠実度3D表現を生成します。
その後,これらの物体に対する物理的に可塑性な軌道と現実的な相互作用を生成するために,物理シミュレータの先行とビデオ拡散モデルに埋め込まれた常識を融合したハイブリッドモーション合成戦略を提案する。
最後に、静的環境と動的オブジェクトをシームレスに融合し、一貫性のある物理的に一貫した4Dシーンに自動合成機構を開発する。
CP4Dは探索可能でインタラクティブな4Dシーンを、高い視覚的忠実度、強い物理的可視性、きめ細かい制御性で生成し、既存の方法よりもはるかに優れることを示した。
プロジェクトページ:https://anonymous.4open.science/w/CP4D/。
関連論文リスト
- Sculpt4D: Generating 4D Shapes via Sparse-Attention Diffusion Transformers [70.55535980817577]
Sculpt4Dはネイティブな4D生成フレームワークで、効率的な時間的モデリングを事前訓練された3Dトランスにシームレスに統合する。
本研究では,Sculpt4Dが時間的コヒーレントな4D合成において新たな最先端を確立し,効率的でスケーラブルな4D生成への道筋を示す。
論文 参考訳(メタデータ) (2026-04-23T12:18:55Z) - Resonance4D: Frequency-Domain Motion Supervision for Preset-Free Physical Parameter Learning in 4D Dynamic Physical Scene Simulation [53.141181758015186]
Resonance4Dは3次元ガウス散乱と物質点法を結合した物理駆動4次元動的シミュレーションフレームワークである。
我々の重要な洞察は、動的整合性は、相補的領域における共同的拘束運動によって、高密度時間発生なしに強制できるということである。
Resonance4Dは、ピークGPUメモリを35,GB以上から20GB程度に削減しつつ、強力な物理忠実性と運動の整合性を実現する。
論文 参考訳(メタデータ) (2026-04-02T13:00:22Z) - Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis [53.48281548500864]
Motion 3-to-4は、単一のモノクロビデオから高品質な4Dダイナミックオブジェクトを合成するためのフィードフォワードフレームワークである。
我々のモデルは、コンパクトな動き潜在表現を学習し、フレーム単位の軌道を予測して、時間的コヒーレントな幾何である完全なロバスト性を取り戻す。
論文 参考訳(メタデータ) (2026-01-20T18:59:48Z) - Restage4D: Reanimating Deformable 3D Reconstruction from a Single Video [56.781766315691854]
ビデオ条件付き4D再生のための幾何学保存パイプラインである textbfRestage4D を紹介する。
DAVIS と PointOdyssey 上のRestage4D の有効性を検証し,幾何整合性,運動品質,3次元追跡性能の向上を実証した。
論文 参考訳(メタデータ) (2025-08-08T21:31:51Z) - 4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives [115.67081491747943]
動的3Dシーン表現と新しいビュー合成はAR/VRおよびメタバースアプリケーションの実現に不可欠である。
我々は,その基礎となる4次元体積を近似として,時間変化の異なる3次元シーンの再構成を再構成する。
ストレージのボトルネックに対処するため、メモリフットプリントを効果的に削減するいくつかのコンパクトなバリエーションを導出する。
論文 参考訳(メタデータ) (2024-12-30T05:30:26Z) - Phys4DGen: Physics-Compliant 4D Generation with Multi-Material Composition Perception [9.355276457984603]
Phys4DGenは、多物質合成知覚と物理シミュレーションを統合する新しい4D生成フレームワークである。
このフレームワークは、3つの革新的なモジュールを通して、自動化され、物理的に妥当な4D生成を実現する。
合成と実世界の両方のデータセットの実験により、Phys4DGenは物理的リアリズムを持つ高忠実な4Dコンテンツを生成可能であることが示された。
論文 参考訳(メタデータ) (2024-11-25T12:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。