論文の概要: DeformMaster: An Interactive Physics-Neural World Model for Deformable Objects from Videos
- arxiv url: http://arxiv.org/abs/2605.09586v1
- Date: Sun, 10 May 2026 14:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.323069
- Title: DeformMaster: An Interactive Physics-Neural World Model for Deformable Objects from Videos
- Title(参考訳): DeformMaster: ビデオから変形可能なオブジェクトの対話型物理ニューラル世界モデル
- Authors: Can Li, Zhoujian Li, Ren Li, Jie Gu, Lei Lei, Jingmin Chen, Lei Sun,
- Abstract要約: DeformMasterは、ビデオから導出されるインタラクティブな物理-ニューラルネットワークの世界モデルで、実際の対話ビデオから変形可能なオブジェクトのオンラインモデルに変換する。
実世界の変形可能なオブジェクトシーケンスの実験は、DeformMasterが将来のダイナミクスをロールアウトし、動的外観をレンダリングする能力を示している。
- 参考スコア(独自算出の注目度): 13.695348404320475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: World models for deformable objects should recover not only geometry and appearance, but also underlying physical dynamics, interaction grounding, and material behavior. Learning such a model from real videos is challenging because deformable linear, planar, and volumetric objects evolve under high-dimensional deformation, noisy interactions, and complex material response. The model must therefore infer a physical state from visual observations, roll it forward under new interactions, and render the resulting dynamics with high visual fidelity. We present DeformMaster, a video-derived interactive physics--neural world model that turns real interaction videos into an online interactive model of deformable objects within a unified dynamics-and-appearance framework. DeformMaster preserves structured physical rollout while using a neural residual to compensate for unmodeled effects, grounds sparse hand motion as distributed compliant actuator for hand--continuum interaction, represents material response with spatially varying constitutive experts, and drives high-fidelity 4D appearance from the predicted physical evolution. Experiments on real-world deformable-object sequences demonstrate DeformMaster's ability to roll out future dynamics and render dynamic appearance, outperforming state-of-the-art baselines while supporting novel action rollout, material-parameter variation, and dynamic novel-view synthesis.
- Abstract(参考訳): 変形可能なオブジェクトの世界モデルは、幾何学や外観だけでなく、基礎となる物理力学、相互作用基盤、物質的挙動も回復する必要がある。
変形可能な線形、平面、体積オブジェクトは、高次元の変形、ノイズのある相互作用、複雑な物質応答の下で進化するため、実際のビデオからそのようなモデルを学習することは困難である。
したがって、モデルは視覚的な観察から物理的状態を推測し、それを新しい相互作用の下で前進させ、その結果のダイナミクスを高い視覚的忠実度でレンダリングする必要がある。
DeformMasterは、ビデオから導出されるインタラクティブな物理-神経の世界モデルであり、実際の対話ビデオを、統一された動的・外観フレームワーク内の変形可能なオブジェクトのオンラインインタラクティブモデルに変換する。
DeformMasterは、未モデル化効果を補うために神経残基を使用しながら構造化された物理的ロールアウトを保持し、手-連続相互作用のための分散共役アクチュエータとしてスパースハンドモーションを接地し、空間的に変化する構成的専門家との物質応答を表現し、予測された物理的進化から高忠実な4D外観を駆動する。
実世界の変形可能なオブジェクトシーケンスの実験では、DeformMasterが将来のダイナミクスをロールアウトし、ダイナミックな外観をレンダリングし、新しいアクションロールアウト、マテリアルパラメータ変動、ダイナミックなノベルビュー合成をサポートしながら、最先端のベースラインを上回っていることを示す。
関連論文リスト
- PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - Phantom: Physics-Infused Video Generation via Joint Modeling of Visual and Latent Physical Dynamics [12.143531149918674]
本稿では,視覚的内容と潜伏する物理力学を共同でモデル化する物理拡散ビデオ生成モデルを提案する。
観測されたビデオフレームと推論された物理状態に基づいて、Phantomは遅延物理的ダイナミクスを共同で予測し、将来のビデオフレームを生成する。
物理認識ビデオ表現の推論を直接ビデオ生成プロセスに統合することにより、Phantomは視覚的にリアルかつ物理的に一貫性のあるビデオシーケンスを生成する。
論文 参考訳(メタデータ) (2026-04-09T17:48:46Z) - PhysWorld: From Real Videos to World Models of Deformable Objects via Physics-Aware Demonstration Synthesis [52.905353023326306]
物理的に妥当で多様な実演を合成し、効率的な世界モデルを学ぶためのフレームワークであるPhysWorldを提案する。
実験により、PhysWorldは、最新の最先端手法、すなわちPhysTwinよりも47倍高速な推論速度を実現しつつ、競争性能を持つことが示された。
論文 参考訳(メタデータ) (2025-10-24T13:25:39Z) - PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos [21.441062722848265]
PhysTwinは、対話中の動的オブジェクトのスパースビデオを使用して、写真と物理的にリアルでリアルタイムなインタラクティブなレプリカを生成する新しいフレームワークである。
提案手法は,(1)現実的な物理シミュレーションのためにバネ質量モデルを組み合わせた物理インフォームド表現,および幾何学のための生成形状モデル,およびレンダリングのためのガウススプラットである。
本手法は,視覚的知覚の手がかりと逆物理の枠組みを統合し,部分的,隠蔽的,限定的な視点からでも高忠実度復元を可能にする。
論文 参考訳(メタデータ) (2025-03-23T07:49:19Z) - InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.38647583839384]
我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブな動画像を生成するフレームワークであるInterDynを提案する。
我々の重要な洞察は、大規模なビデオ生成モデルは、大規模ビデオデータからインタラクティブなダイナミクスを学習し、ニューラルと暗黙の物理シミュレーターの両方として機能できるということです。
論文 参考訳(メタデータ) (2024-12-16T13:57:02Z) - OCK: Unsupervised Dynamic Video Prediction with Object-Centric Kinematics [22.119612406160073]
我々は,オブジェクト中心キネマティクスとオブジェクトスロットを利用した動的ビデオ予測モデルOCKを提案する。
本稿では,対象運動を明示する新しいコンポーネントであるObject Kinematicsを紹介する。
複雑なオブジェクト属性と動きを持つ複雑なシーンにおいて,本モデルは優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-29T04:47:23Z) - PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation [62.53760963292465]
PhysDreamerは物理に基づくアプローチで、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える。
本稿では, 弾性物体の多様な例について考察し, ユーザスタディを通じて合成された相互作用の現実性を評価する。
論文 参考訳(メタデータ) (2024-04-19T17:41:05Z) - Real-time Deep Dynamic Characters [95.5592405831368]
本研究では,高度にリアルな形状,動き,ダイナミックな外観を示す3次元人物モデルを提案する。
我々は,新しいグラフ畳み込みネットワークアーキテクチャを用いて,身体と衣服の運動依存的変形学習を実現する。
本モデルでは, 運動依存的表面変形, 物理的に妥当な動的衣服変形, および映像現実的表面テクスチャを, 従来よりも細部まで高レベルに生成することを示す。
論文 参考訳(メタデータ) (2021-05-04T23:28:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。