論文の概要: FunRec: Reconstructing Functional 3D Scenes from Egocentric Interaction Videos
- arxiv url: http://arxiv.org/abs/2604.05621v1
- Date: Tue, 07 Apr 2026 09:22:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.732015
- Title: FunRec: Reconstructing Functional 3D Scenes from Egocentric Interaction Videos
- Title(参考訳): FunRec:エゴセントリックなインタラクションビデオから機能的な3Dシーンを再構築
- Authors: Alexandros Delitzas, Chenyangguang Zhang, Alexey Gavryushin, Tommaso Di Mario, Boyang Sun, Rishabh Dabral, Leonidas Guibas, Christian Theobalt, Marc Pollefeys, Francis Engelmann, Daniel Barath,
- Abstract要約: 本稿では,エゴセントリックなRGB-Dインタラクションビデオから直接室内シーンの3次元ディジタル双対を再構成するFunRecを提案する。
本研究では,URDF/USDエクスポートのシミュレーション,手指のアベイランスマッピング,ロボットとシーンのインタラクションへの応用を実演する。
- 参考スコア(独自算出の注目度): 134.8812117202239
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present FunRec, a method for reconstructing functional 3D digital twins of indoor scenes directly from egocentric RGB-D interaction videos. Unlike existing methods on articulated reconstruction, which rely on controlled setups, multi-state captures, or CAD priors, FunRec operates directly on in-the-wild human interaction sequences to recover interactable 3D scenes. It automatically discovers articulated parts, estimates their kinematic parameters, tracks their 3D motion, and reconstructs static and moving geometry in canonical space, yielding simulation-compatible meshes. Across new real and simulated benchmarks, FunRec surpasses prior work by a large margin, achieving up to +50 mIoU improvement in part segmentation, 5-10 times lower articulation and pose errors, and significantly higher reconstruction accuracy. We further demonstrate applications on URDF/USD export for simulation, hand-guided affordance mapping and robot-scene interaction.
- Abstract(参考訳): 本稿では,エゴセントリックなRGB-Dインタラクションビデオから直接室内シーンの3次元ディジタル双対を再構成するFunRecを提案する。
制御されたセットアップ、マルチステートキャプチャ、CADプリエントに依存する既存のオーケストレート再構築法とは異なり、FunRecは、操作可能な3Dシーンを直接操作する。
関節部分を自動的に発見し、運動パラメータを推定し、3次元の動きを追跡し、標準空間における静的および運動幾何学を再構築し、シミュレーション互換メッシュを生成する。
新たな実数とシミュレートされたベンチマーク全体にわたって、FunRecは以前の作業よりも大きなマージンで、パートセグメンテーションで最大+50 mIoUの改善、調音とポーズエラーの5~10倍、再現精度が大幅に向上した。
さらに、URDF/USDエクスポートのシミュレーション、手指のアベイランスマッピング、ロボットとシーンのインタラクションへの応用を実証する。
関連論文リスト
- CRISP: Contact-Guided Real2Sim from Monocular Video with Planar Scene Primitives [65.89192712575797]
本研究では,モノクロ映像から再現可能な人物の動きとシーン形状を復元するCRISPを紹介する。
我々の手法は、人中心のビデオベンチマークにおいて、モーショントラッキングの失敗率を55.2%から6.9%に下げる。
このことは、CRISPが物理的に有意な人間の動きと対話環境を大規模に生成する能力を示している。
論文 参考訳(メタデータ) (2025-12-16T18:59:50Z) - REACT3D: Recovering Articulations for Interactive Physical 3D Scenes [96.27769519526426]
REACT3Dは静的な3Dシーンを一貫した幾何学を持つシミュレーション可能なインタラクティブなレプリカに変換するフレームワークである。
室内の様々な場面における検出・分離・調音計測における最先端性能について検討した。
論文 参考訳(メタデータ) (2025-10-13T12:37:59Z) - HOSt3R: Keypoint-free Hand-Object 3D Reconstruction from RGB images [27.025336665386735]
モノクロモーションビデオ/画像から手動3D変換を推定するための,ロバストでキーポイントのない手法を提案する。
さらにこれを多視点再構成パイプラインに統合し,手動物体の形状を正確に復元する。
提案手法は,HOSt3Rと命名され,非拘束であり,事前スキャンされたオブジェクトテンプレートやカメラ内在性に依存しず,最先端の性能に達する。
論文 参考訳(メタデータ) (2025-08-22T15:30:40Z) - Reconstructing Interactive 3D Scenes by Panoptic Mapping and CAD Model
Alignments [81.38641691636847]
エンボディエージェントの観点から,シーン再構築の問題を再考する。
rgb-dデータストリームを用いてインタラクティブシーンを再構築する。
この再構成されたシーンは、密集したパノプティカルマップのオブジェクトメッシュを、部分ベースのCADモデルに置き換える。
論文 参考訳(メタデータ) (2021-03-30T05:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。