論文の概要: MatPhys: Learning Material-Aware Physics Parameters for Deformable Object Simulation from Videos
- arxiv url: http://arxiv.org/abs/2605.19386v1
- Date: Tue, 19 May 2026 05:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.14161
- Title: MatPhys: Learning Material-Aware Physics Parameters for Deformable Object Simulation from Videos
- Title(参考訳): MatPhys:ビデオから変形可能な物体シミュレーションのための物質認識物理パラメータの学習
- Authors: Yang Yang, Yiyan Wang, Zheming Liu, Naoya Iwamoto,
- Abstract要約: MatPhysは、シングルビュービデオからバネマスパラメータを予測する、素材対応フィードフォワードフレームワークである。
出現と物理の橋渡しとして,共有材料埋め込みの学習資料コードブックを紹介した。
- 参考スコア(独自算出の注目度): 5.311784504987869
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Reconstructing simulation-ready deformable objects is important for vision, graphics, and robotics. Existing physics-driven methods can recover physical digital twins from videos, but they suffer from two fundamental limitations: they typically assume a homogeneous material across the whole object, and their scene-specific inverse optimization, combined with the inherent ambiguity of monocular observation, yields inconsistent parameters for the same material across different scenes or interactions. We propose MatPhys, a material-aware feed-forward framework that predicts spring-mass parameters from a single-view video, addressing these two issues with two coupled designs. To relax the homogeneous material assumption, we use DINO features to decompose the object into semantically meaningful parts and to query a part-level material prior, assigning each part its own physical behavior. To enforce cross-scene consistency, we introduce a learned material codebook of shared material embeddings as the bridge between appearance and physics, and further use the part-level prior as a reference distribution that constrains the decoder so that the same material yields consistent parameters across scenes and interactions. Together, these designs turn an under-constrained monocular problem into feed-forward inference grounded on shared, reusable material concepts. Experiments show that our method matches per-scene optimization baselines in reconstruction and future prediction, while achieving stronger generalization to unseen interactions and objects with more consistent physical parameters.
- Abstract(参考訳): シミュレーション可能な変形可能なオブジェクトの再構成は、視覚、グラフィックス、ロボット工学において重要である。
既存の物理駆動の手法は、ビデオから物理的デジタル双対を復元することができるが、それらは通常、オブジェクト全体にわたって均質な物質を仮定し、そのシーン固有の逆最適化とモノクロ観察の固有のあいまいさを組み合わせ、異なるシーンや相互作用で同じ物質に対して矛盾するパラメータを出力する、という2つの根本的な制限を負う。
そこで我々は,この2つの問題を2つの複合設計で解決し,一視点ビデオからバネマスパラメータを予測する,材料対応フィードフォワードフレームワークであるMatPhysを提案する。
均質な物質仮定を緩和するために、DINO特徴を用いてオブジェクトを意味論的に意味のある部分に分解し、各部分の物理的な振る舞いを割り当て、あらかじめ部分レベルの物質を問合せする。
クロスシーン一貫性を実現するため,我々は,共有材料埋め込みの学習資料コードブックを外観と物理の橋渡しとして導入し,さらに,デコーダを制約する参照分布として部分レベル事前を用いて,シーンとインタラクション間の一貫したパラメータを生成する。
これらの設計は、制約の少ない単分子問題を、共有された再利用可能な材料概念に基づくフィードフォワード推論に変換する。
実験により,本手法は再現性および将来の予測におけるシーンごとの最適化基準値と一致し,より一貫した物理パラメータを持つ未確認インタラクションやオブジェクトへのより強力な一般化を実現する。
関連論文リスト
- PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - MMPhysVideo: Scaling Physical Plausibility in Video Generation via Joint Multimodal Modeling [55.72785604682579]
MMPhysVideoは、共同マルチモーダルモデリングにおけるビデオ生成における物理的可視性を拡大するフレームワークである。
MMPhysVideoは、様々なベンチマークで高度なモデルよりも、物理的な可視性と視覚的品質を一貫して改善している。
論文 参考訳(メタデータ) (2026-04-03T07:32:24Z) - PhysAlign: Physics-Coherent Image-to-Video Generation through Feature and 3D Representation Alignment [23.066204478030627]
ビデオモデル(VDM)は、動的なシーンや環境をシミュレートするための有望なアプローチを提供する。
既存のモデルは、しばしば基本的な物理的直観に反する時間的に一貫性のないコンテンツを生成する。
物理コヒーレントな画像対ビデオI(2V)生成のための効率的なフレームワークであるPhysAlignを提案する。
論文 参考訳(メタデータ) (2026-03-14T05:44:18Z) - M-PhyGs: Multi-Material Object Dynamics from Video [26.24580584792261]
ビデオから複雑な自然物の材料組成とパラメータを推定するために,多物質物理ガウス(M-PhyGs)を導入する。
自然の環境で撮影された短いビデオから、M-PhyGsは物体を同様の物質に分割し、重力を考慮しながら連続的な機械的パラメータを復元する。
花と対話する人々のデータセットであるPhlowersを新しいプラットフォームとして導入し、多物質物理パラメータ推定におけるこの課題の精度を評価する。
論文 参考訳(メタデータ) (2025-12-18T18:50:08Z) - Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects [59.51185639557874]
本稿では,任意のRGB画像やテキスト記述から直接音声オブジェクトを合成するフレームワークであるKinematifyを紹介する。
提案手法は, 高DoFオブジェクトに対する運動的トポロジの推測と静的幾何からの関節パラメータの推定という2つの課題に対処する。
論文 参考訳(メタデータ) (2025-11-03T07:21:42Z) - MASIV: Toward Material-Agnostic System Identification from Videos [76.36666848173141]
MASIVは、物質に依存しないシステム識別のためのビジョンベースのフレームワークである。
学習可能なニューラルモデルを採用し、シーン固有の物質を事前に仮定することなく、オブジェクトのダイナミクスを推定する。
幾何的精度、レンダリング品質、一般化能力において最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-08-01T23:23:45Z) - PhysGaia: A Physics-Aware Dataset of Multi-Body Interactions for Dynamic Novel View Synthesis [62.283499219361595]
PhysGaiaは動的ノベルビュー合成(DyNVS)のために設計された物理対応のデータセットである。
私たちのデータセットは、複数のオブジェクト間のリッチな相互作用を伴う複雑な動的シナリオを提供します。
PhysGaiaは、動的ビュー合成、物理に基づくシーン理解、および物理シミュレーションと統合されたディープラーニングモデルの研究を著しく前進させる。
論文 参考訳(メタデータ) (2025-06-03T12:19:18Z) - Occlusion resistant learning of intuitive physics from videos [52.25308231683798]
人工システムの鍵となる能力は、オブジェクト間の物理的相互作用を理解し、状況の将来的な結果を予測することである。
この能力は直感的な物理学と呼ばれ、近年注目されており、ビデオシーケンスからこれらの物理規則を学ぶためのいくつかの方法が提案されている。
論文 参考訳(メタデータ) (2020-04-30T19:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。