論文の概要: MonoPhysics: Estimating Geometry, Appearance, and Physical Parameters from Monocular Videos
- arxiv url: http://arxiv.org/abs/2605.30320v1
- Date: Thu, 28 May 2026 17:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.730593
- Title: MonoPhysics: Estimating Geometry, Appearance, and Physical Parameters from Monocular Videos
- Title(参考訳): モノフィジック:モノフィジックビデオから幾何学・外観・物理パラメータを推定する
- Authors: Daniel Rho, Jun Myeong Choi, Matthew Thornton, Biswadip Dey, Roni Sengupta,
- Abstract要約: MonoPhysicsは、単一のカメラビューから変形可能なオブジェクトを逆物理で推定するフレームワークである。
我々は,グローバルスケールアライメント,物理を意識した幾何補正,微分可能な位置マップという3つの視覚物理ブリッジを通じて,課題に対処する。
Vid2Simと新しい弾性および塑性オブジェクトのデータセットを評価し,MonoPhysicsがモノクラーセッティングにおいて既存のベースラインより優れていることを示す。
- 参考スコア(独自算出の注目度): 12.038095202551267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing inverse physics methods recover physical parameters from multi-view videos, where geometric constraints across views resolve scale and 3D structure. In monocular settings, however, such constraints are absent, leading to severe scale ambiguity, inaccurate geometry, and weak coupling between appearance optimization and physical simulation. We propose MonoPhysics, a framework for monocular inverse physics estimation of deformable objects using differentiable MPM simulation and 3D Gaussian Splatting, which jointly optimizes geometry, appearance, and physical parameters from a single camera view. We address these challenges through three visual-physical bridges: global scale alignment, physics-aware geometry refinement, and a differentiable position map, which together enable accurate optimization from monocular observations alone. We evaluate on Vid2Sim and our new dataset of elastic and plastic objects, showing that MonoPhysics outperforms existing baselines in monocular settings and achieves performance comparable to multi-view baselines using only a single camera. Our project page is available at https://daniel03c1.github.io/MonoPhysics/
- Abstract(参考訳): 既存の逆物理法は、ビュー間の幾何的制約がスケールと3D構造を分解するマルチビュービデオから物理パラメータを復元する。
しかし、単分子的な設定ではそのような制約は欠如しており、厳密なスケールの曖昧さ、不正確な幾何学、外観最適化と物理シミュレーションの間の弱い結合をもたらす。
我々は,モノフィジックス(MonoPhysics, MonoPhysics, モノフィジカル逆物理推定フレームワーク)を提案する。これは, 微分可能なMPMシミュレーションと3次元ガウススプラッティングを用いて, 単一のカメラビューから幾何学, 外観, 物理パラメータを共同で最適化する。
これらの課題は、グローバルスケールアライメント(英語版)、物理を意識した幾何補正(英語版)、および単分子観測のみで正確な最適化を可能にする微分可能な位置マップの3つの視覚物理ブリッジを通して解決される。
我々は、Vid2Simと新しい弾塑性およびプラスチックオブジェクトのデータセットを評価し、MonoPhysicsがモノクロ設定で既存のベースラインより優れており、1台のカメラだけでマルチビューベースラインに匹敵する性能を実現していることを示した。
私たちのプロジェクトページはhttps://daniel03c1.github.io/MonoPhysics/で公開されています。
関連論文リスト
- TelePhysics: Physics-Grounded Multi-Object Scene Generation from a Single Image with Real-Time Interaction [51.01447538245441]
トレーニング不要なフレームワークであるTelePhysicsを提案する。
空間座標系で全シーンの幾何学を表現することで、TelePhysicsは物体の侵入とアライメントのあいまいさを解消する。
実験結果から,TelePhysicsは,物理忠実度,空間コヒーレンス,制御性において,従来手法よりも大幅に優れていたことがわかった。
論文 参考訳(メタデータ) (2026-05-19T08:16:44Z) - PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - PhysAlign: Physics-Coherent Image-to-Video Generation through Feature and 3D Representation Alignment [23.066204478030627]
ビデオモデル(VDM)は、動的なシーンや環境をシミュレートするための有望なアプローチを提供する。
既存のモデルは、しばしば基本的な物理的直観に反する時間的に一貫性のないコンテンツを生成する。
物理コヒーレントな画像対ビデオI(2V)生成のための効率的なフレームワークであるPhysAlignを提案する。
論文 参考訳(メタデータ) (2026-03-14T05:44:18Z) - VideoArtGS: Building Digital Twins of Articulated Objects from Monocular Video [60.63575135514847]
モノクロビデオから音声化されたオブジェクトのデジタルツインを構築することは、コンピュータビジョンにおいて重要な課題である。
本稿では,モノクロ映像から高忠実度デジタル双対を再構成する新しい手法であるVideoArtGSを紹介する。
VideoArtGSは、調音およびメッシュ再構成における最先端性能を示し、既存の方法に比べて約2桁の再現誤差を低減している。
論文 参考訳(メタデータ) (2025-09-22T11:52:02Z) - PhysGM: Large Physical Gaussian Model for Feed-Forward 4D Synthesis [37.21119648359889]
PhysGMはフィードフォワードフレームワークであり、単一の画像から3次元ガウス表現とその物理的特性を共同で予測する。
1分で1枚の画像から高忠実度4Dシミュレーションを効果的に生成する。
論文 参考訳(メタデータ) (2025-08-19T15:10:30Z) - NeuPhysics: Editable Neural Geometry and Physics from Monocular Videos [82.74918564737591]
本稿では,モノクラーRGBビデオ入力のみから動的シーンの3次元形状と物理パラメータを学習する手法を提案する。
実験により,提案手法は,競合するニューラルフィールドアプローチと比較して,動的シーンのメッシュとビデオの再構成に優れることを示した。
論文 参考訳(メタデータ) (2022-10-22T04:57:55Z) - {\phi}-SfT: Shape-from-Template with a Physics-Based Deformation Model [69.27632025495512]
Shape-from-Template (SfT) 法では、単一の単眼RGBカメラから3次元表面の変形を推定する。
本稿では,物理シミュレーションによる2次元観察を解説する新しいSfT手法を提案する。
論文 参考訳(メタデータ) (2022-03-22T17:59:57Z) - Occlusion resistant learning of intuitive physics from videos [52.25308231683798]
人工システムの鍵となる能力は、オブジェクト間の物理的相互作用を理解し、状況の将来的な結果を予測することである。
この能力は直感的な物理学と呼ばれ、近年注目されており、ビデオシーケンスからこれらの物理規則を学ぶためのいくつかの方法が提案されている。
論文 参考訳(メタデータ) (2020-04-30T19:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。