論文の概要: SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image
- arxiv url: http://arxiv.org/abs/2606.03994v1
- Date: Tue, 02 Jun 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:05.25065
- Title: SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image
- Title(参考訳): SimuScene: 単一画像からのシミュレーション可能な合成3Dシーン再構成
- Authors: Inhee Lee, Sangwon Baik, Sungjoo Kim, Hyeonwoo Kim, Hyunsoo Cha, Hanbyul Joo,
- Abstract要約: 物理を形状とレイアウト推定のループに配置する構成的3次元再構成パイプラインであるSimuSceneを紹介する。
重力下で再構成された物体を診断的にシミュレートすることにより、浸透と故障を定量的な補正信号に変換する。
この物理インフォームドフィードバックループは、蓄積した再構成誤差を軽減し、安定したシミュレーション可能なシーンを生成する。
- 参考スコア(独自算出の注目度): 18.870075620011615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing interactive, simulation-ready 3D scenes from a single image is a critical bottleneck for robotic manipulation. While recent single-image lifters recover plausible per-object shapes, composing them yields scenes that collapse under physical simulation due to interpenetrating, hovering, or sinking objects. Existing physics-aware methods address this strictly as a post-hoc layout correction, leaving the underlying geometric errors unresolved. To address this, we introduce SimuScene, a compositional 3D reconstruction pipeline that puts physics in the loop of shape and layout estimation. Rather than using physics merely for layout cleanup, we utilize the physics engine as a diagnostic measurement tool during the generative process itself. By diagnostically simulating reconstructed objects under gravity, we convert penetration and support failures into quantitative correction signals that drive gravity-axis stretching and amodal shape resampling. This physics-informed feedback loop mitigates accumulated reconstruction errors and produces a stable, simulation-ready compositional 3D scene. Extensive experiments demonstrate state-of-the-art performance on physical stability and geometric alignment benchmarks. We further highlight SimuScene's utility by deploying reconstructed environments in humanoid control and robot-arm manipulation tasks.
- Abstract(参考訳): 1枚の画像からインタラクティブでシミュレーション可能な3Dシーンを再構築することは、ロボット操作にとって重要なボトルネックとなる。
最近のシングルイメージリフターは、物体ごとの可視な形状を復元する一方、それらを構成するシーンは、相互接続、ホバリング、あるいは沈む物体によって物理的シミュレーションの下で崩壊する。
既存の物理学的手法は、これを厳密に解決し、下層の幾何学的誤りを未解決のままにしておく。
そこで本研究では,形状とレイアウト推定のループに物理を配置する構成的3次元再構成パイプラインであるSimuSceneを紹介する。
物理を単にレイアウトのクリーンアップに使用するのではなく、生成過程自体の診断ツールとして物理エンジンを利用する。
重力下で再構成された物体を診断的にシミュレートすることにより、浸透と支持の失敗を重力軸ストレッチやアモーダル形状のリサンプリングを駆動する定量的な補正信号に変換する。
この物理インフォームドフィードバックループは、蓄積した再構成誤差を軽減し、安定でシミュレーション可能な合成3Dシーンを生成する。
大規模な実験は、物理安定性と幾何アライメントベンチマークにおける最先端の性能を示す。
ヒューマノイド制御およびロボットアーム操作タスクにおいて,再構成環境を配置することで,SimuSceneの実用性をさらに強調する。
関連論文リスト
- GARDEN: Gravity-Aligned Reconstruction of Disentangled ENvironments from RGB images [61.2170105836525]
本稿では,RGBのみのフレームワークを提案する。このフレームワークは,再構成を物理的に地上に配置したシーンファクタ化として再構成し,構造化されたハイブリッドシーン表現を出力する。
結果として得られる表現は、明示的な剛体と分離された背景を組み合わせることで、視覚的リアリズムを維持しながら直接物理シミュレーションを可能にする。
論文 参考訳(メタデータ) (2026-06-02T17:13:01Z) - REST3D: Reconstructing Physically Stable 3D Scenes from a Single Image [31.061246129846044]
1枚のRGB画像から物理的に安定な3Dシーンを再構成することで、カジュアル画像をシミュレーション可能なデジタルアセットに変換することができる。
物理的シーン理解と物理制約のある精細化を統合することで、物理的に安定な3Dシーンを再構成できる単一画像再構成フレームワークであるREST3Dを提案する。
論文 参考訳(メタデータ) (2026-05-28T17:59:01Z) - SAM3D-Phys: Towards Multi-Object Interactive Simulation in Real World [42.46212677643043]
SAM3D-Physは、シーン再構成とSAM3Dの3D先行生成を統合し、物理的にシミュレート可能なオブジェクトを復元するフレームワークである。
完全なオブジェクト形状を復元し、シーン内のポーズと外観を復元することにより、SAM3D-Physは物理シミュレーションに適したクリーンなオブジェクト表現を生成する。
論文 参考訳(メタデータ) (2026-05-28T17:07:51Z) - TelePhysics: Physics-Grounded Multi-Object Scene Generation from a Single Image with Real-Time Interaction [51.01447538245441]
トレーニング不要なフレームワークであるTelePhysicsを提案する。
空間座標系で全シーンの幾何学を表現することで、TelePhysicsは物体の侵入とアライメントのあいまいさを解消する。
実験結果から,TelePhysicsは,物理忠実度,空間コヒーレンス,制御性において,従来手法よりも大幅に優れていたことがわかった。
論文 参考訳(メタデータ) (2026-05-19T08:16:44Z) - HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions [69.43316445143408]
HSImul3Rはヒトとシーンの相互作用をシミュレーション可能な3次元再構成のための統合フレームワークである。
既存の手法は知覚とシミュレーションのギャップに悩まされており、物理エンジンの不安定性と、具体化されたAIアプリケーションの失敗につながっている。
論文 参考訳(メタデータ) (2026-03-16T17:58:33Z) - PAT3D: Physics-Augmented Text-to-3D Scene Generation [47.18949891825537]
PAT3Dは3Dオブジェクトを生成し、それらの空間的関係を推測し、それらを階層的なシーンツリーに整理する。
微分可能な剛体シミュレータは、重力下での現実的な物体の相互作用を保証する。
実験により、PAT3Dは、物理的妥当性、意味的一貫性、視覚的品質において、従来のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-11-26T23:23:58Z) - Dynamic Scene 3D Reconstruction of an Uncooperative Resident Space Object [0.0]
本研究では,動的シーンに対する既存の最先端3次元再構成アルゴリズムの性能評価を行う。
Neuralangelo を用いた静的シーンの予備的な結果から, 良好な再現性が確認された。
論文 参考訳(メタデータ) (2025-09-09T17:16:38Z) - Is Single-View Mesh Reconstruction Ready for Robotics? [78.14584238127338]
本研究では,ロボット操作のための物理シミュレータを用いたリアルタイム計画と動的予測のためのディジタル双対生成の実現の可能性について,単一ビューメッシュ再構成モデルの評価を行った。
我々の研究は、コンピュータビジョンの進歩とロボティクスの必要性の間に重要なギャップがあることを浮き彫りにし、この交差点における将来の研究を導く。
論文 参考訳(メタデータ) (2025-05-23T14:35:56Z) - DreamPhysics: Learning Physics-Based 3D Dynamics with Video Diffusion Priors [75.83647027123119]
本稿では,映像拡散前の物体の物理的特性を学習することを提案する。
次に,物理に基づくMaterial-Point-Methodシミュレータを用いて,現実的な動きを伴う4Dコンテンツを生成する。
論文 参考訳(メタデータ) (2024-06-03T16:05:25Z) - GeoSim: Photorealistic Image Simulation with Geometry-Aware Composition [81.24107630746508]
GeoSimは、新しい都市の運転シーンを合成するジオメトリ認識の画像合成プロセスです。
まず、センサーデータからリアルな形状と外観の両方を備えた多様な3Dオブジェクトのバンクを構築します。
得られた合成画像は、フォトリアリズム、トラフィック認識、幾何学的一貫性があり、画像シミュレーションが複雑なユースケースにスケールできる。
論文 参考訳(メタデータ) (2021-01-16T23:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。