論文の概要: SAM3D-Phys: Towards Multi-Object Interactive Simulation in Real World
- arxiv url: http://arxiv.org/abs/2605.30239v1
- Date: Thu, 28 May 2026 17:07:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.572029
- Title: SAM3D-Phys: Towards Multi-Object Interactive Simulation in Real World
- Title(参考訳): SAM3D-Phys:実世界のマルチオブジェクトインタラクティブシミュレーションを目指して
- Authors: Xin Dong, Weijian Deng, Lihan Zhang, Tianru Dai, Wenfeng Deng, Yansong Tang,
- Abstract要約: SAM3D-Physは、シーン再構成とSAM3Dの3D先行生成を統合し、物理的にシミュレート可能なオブジェクトを復元するフレームワークである。
完全なオブジェクト形状を復元し、シーン内のポーズと外観を復元することにより、SAM3D-Physは物理シミュレーションに適したクリーンなオブジェクト表現を生成する。
- 参考スコア(独自算出の注目度): 42.46212677643043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work addresses the problem of recovering complete, simulatable object geometry from reconstructed real-world scenes, enabling physics-based interaction with objects embedded in the scene. While modern multi-view reconstruction methods can produce visually accurate environments, objects are often incomplete due to occlusions and limited observations, making them unsuitable for physics simulation. To address this limitation, we propose SAM3D-Phys, a framework that integrates scene reconstruction with generative 3D priors of SAM3D to recover physically simulatable objects. Our approach first reconstructs the scene from multi-view images to obtain scene geometry and partial observations of objects. We then leverage SAM3D to infer complete object geometry from these partial observations. To ensure that the recovered objects remain consistent with the reconstructed scene, we restore scene-consistent object states through two complementary strategies: a physics-constrained spatial optimization algorithm that iteratively aligns the recovered object to its original location, and a mask-guided appearance distillation module that refines texture fidelity based on the observed images. By recovering complete object geometry and restoring its pose and appearance within the scene, SAM3D-Phys produces clean object representations suitable for physics-based simulation, enabling simultaneous and physically consistent interactive simulation of multiple objects within a reconstructed scene. Project page: https://chnxindong.github.io/sam3d-phys/
- Abstract(参考訳): この研究は、再現された現実世界のシーンから完全でシミュレート可能なオブジェクト幾何学を復元する問題に対処し、シーンに埋め込まれたオブジェクトとの物理に基づく相互作用を可能にする。
現代の多視点再構成法は視覚的に正確な環境を作り出すことができるが、物体は閉塞や限られた観測のために不完全であり、物理シミュレーションには適さない。
この制限に対処するために,SAM3D のシーン再構成と SAM3D の3次元先行生成を統合し,物理的にシミュレート可能なオブジェクトを復元するフレームワーク SAM3D-Phys を提案する。
提案手法は,まず多視点画像からシーンを再構成し,シーン形状と物体の部分的な観察値を得る。
次に、SAM3Dを利用して、これらの部分的な観測から完全な物体形状を推測する。
復元されたオブジェクトが復元されたシーンと整合性を保つために,復元されたオブジェクトを元の場所に反復的に整列する物理制約空間最適化アルゴリズムと,観察された画像に基づいてテクスチャの忠実度を向上するマスクガイド付き外観蒸留モジュールの2つの相補的な戦略により,シーン一貫性のあるオブジェクト状態を復元する。
SAM3D-Physは、完全なオブジェクト形状を復元し、シーン内のポーズと外観を復元することにより、物理シミュレーションに適したクリーンなオブジェクト表現を生成し、再構成されたシーン内の複数のオブジェクトの同時かつ物理的に一貫したインタラクティブなシミュレーションを可能にする。
プロジェクトページ: https://chnxindong.github.io/sam3d-phys/
関連論文リスト
- REST3D: Reconstructing Physically Stable 3D Scenes from a Single Image [31.061246129846044]
1枚のRGB画像から物理的に安定な3Dシーンを再構成することで、カジュアル画像をシミュレーション可能なデジタルアセットに変換することができる。
物理的シーン理解と物理制約のある精細化を統合することで、物理的に安定な3Dシーンを再構成できる単一画像再構成フレームワークであるREST3Dを提案する。
論文 参考訳(メタデータ) (2026-05-28T17:59:01Z) - MessyKitchens: Contact-rich object-level 3D scene reconstruction [26.192713922771244]
乱雑な環境を特徴とする現実世界のシーンを備えた新しいデータセットであるMessyKitchensを紹介した。
近年のSAM 3Dによる単一オブジェクト再構成手法をベースとして,複数オブジェクトデコーダ(MOD)を用いてオブジェクトレベルの共同再構成を実現している。
論文 参考訳(メタデータ) (2026-03-17T17:59:51Z) - CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image [44.8172828045897]
現在のメソッドはドメイン固有の制限や低品質のオブジェクト生成に悩まされることが多い。
本稿では,3次元シーンの復元と復元のための新しい手法であるCASTを提案する。
論文 参考訳(メタデータ) (2025-02-18T14:29:52Z) - Efficient Physics Simulation for 3D Scenes via MLLM-Guided Gaussian Splatting [32.846428862045634]
Sim Anythingは、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える物理ベースのアプローチである。
人間の視覚的推論に触発されて,MLLMに基づく物理特性知覚を提案する。
また、物理幾何学的適応サンプリングを用いて粒子をサンプリングして、オープンワールドシーンでオブジェクトをシミュレートする。
論文 参考訳(メタデータ) (2024-11-19T12:52:21Z) - Physically Compatible 3D Object Modeling from a Single Image [109.98124149566927]
単一画像を3次元物理オブジェクトに変換するフレームワークを提案する。
我々のフレームワークは、リコンストラクションプロセスに物理的な互換性を組み込む。
既存の手法よりも3Dモデルの物理的リアリズムを一貫して強化する。
論文 参考訳(メタデータ) (2024-05-30T21:59:29Z) - Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。
提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-03-21T17:59:59Z) - Occlusion resistant learning of intuitive physics from videos [52.25308231683798]
人工システムの鍵となる能力は、オブジェクト間の物理的相互作用を理解し、状況の将来的な結果を予測することである。
この能力は直感的な物理学と呼ばれ、近年注目されており、ビデオシーケンスからこれらの物理規則を学ぶためのいくつかの方法が提案されている。
論文 参考訳(メタデータ) (2020-04-30T19:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。