Fugu-MT 論文翻訳(概要): Reconstruction by Generation: 3D Multi-Object Scene Reconstruction from Sparse Observations

論文の概要: Reconstruction by Generation: 3D Multi-Object Scene Reconstruction from Sparse Observations

arxiv url: http://arxiv.org/abs/2604.27106v1
Date: Wed, 29 Apr 2026 18:51:21 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:53.762546
Title: Reconstruction by Generation: 3D Multi-Object Scene Reconstruction from Sparse Observations
Title（参考訳）: 生成による再構成:スパース観測による3次元多目的シーン再構成
Authors: Andrii Zadaianchuk, Leonardo Barcellona, Lennard Schuenemann, Christian Gumbsch, Zehao Wang, Muhammad Zubair Irshad, Fabien Despinoy, Rahaf Aljundi, Stratis Gavves, Sergey Zakharov,
Abstract要約: RecGenは、オブジェクトと部分形状の確率的共同推定のための生成フレームワークである。多様なオブジェクトタイプと現実世界環境にまたがって一般化される。 RecGenは、複雑で排他的なデータセットで最先端のパフォーマンスを達成する。
参考スコア（独自算出の注目度）: 29.241988496403383
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurately reconstructing complex full multi-object scenes from sparse observations remains a core challenge in computer vision and a key step toward scalable and reliable simulation for robotics. In this work, we introduce RecGen, a generative framework for probabilistic joint estimation of object and part shapes, as well as their pose under occlusion and partial visibility from one or multiple RGB-D images. By leveraging compositional synthetic scene generation and strong 3D shape priors, RecGen generalizes across diverse object types and real-world environments. RecGen achieves state-of-the-art performance on complex, heavily occluded datasets, robustly handling severe occlusions, symmetric objects, object parts, and intricate geometry and texture. Despite using nearly 80% fewer training meshes than the previous state of the art SAM3D, RecGen outperforms it by 30.1% in geometric shape quality, 9.1% in texture reconstruction, and 33.9% in pose estimation.
Abstract（参考訳）: スパース観測から複雑なマルチオブジェクトシーンを正確に再構築することは、コンピュータビジョンの中核的な課題であり、ロボット工学のスケーラブルで信頼性の高いシミュレーションに向けた重要なステップである。本研究では,物体と部分形状の確率的関節推定のための生成フレームワークであるRecGenを紹介する。 RecGenは、合成シーンの生成と強力な3D形状の事前情報を活用することで、多様なオブジェクトタイプと現実世界環境を一般化する。 RecGenは、複雑な、非常に隠蔽されたデータセットで最先端のパフォーマンスを実現し、厳しいオクルージョン、対称オブジェクト、オブジェクト部分、複雑な幾何学とテクスチャを堅牢に扱う。従来のSAM3Dよりも80%ほど少ないトレーニングメッシュを使用しているにもかかわらず、RecGenは幾何学的な形状の質で30.1%、テクスチャの再構築で9.1%、ポーズの見積もりで33.9%で性能を向上している。

関連論文リスト

ArtLLM: Generating Articulated Assets via 3D LLM [19.814132638278547]
ArtLLMは、完全な3Dメッシュから直接高品質な調音資産を生成するための新しいフレームワークである。コアとなるのは,大規模な調音データセットに基づいてトレーニングされた,3Dマルチモーダルな大規模言語モデルだ。実験の結果,ArtLLMは部品配置精度と接合予測の両方で最先端の手法を著しく上回ることがわかった。
論文参考訳（メタデータ） (2026-03-01T15:07:46Z)
DreamGrasp: Zero-Shot 3D Multi-Object Reconstruction from Partial-View Images for Robotic Manipulation [12.812918371506209]
シーンの未観測部分を推論するフレームワークであるDreamGraspを紹介します。粗い3D再構成、対照的な学習によるインスタンスセグメンテーション、テキスト誘導型インスタンスワイドリファインメントを組み合わせることで、DreamGraspは以前の方法の制限を回避することができる。実験の結果,DreamGraspは正確なオブジェクト形状を復元するだけでなく,シーケンシャルなデクラッタリングや高い成功率のターゲット検索といった下流タスクもサポートしていることがわかった。
論文参考訳（メタデータ） (2025-07-08T03:12:49Z)
GTR: Gaussian Splatting Tracking and Reconstruction of Unknown Objects Based on Appearance and Geometric Complexity [49.31257173003408]
モノクローナルRGBDビデオからの6-DoFオブジェクト追跡と高品質な3D再構成のための新しい手法を提案する。提案手法は, 高忠実度オブジェクトメッシュを復元する強力な能力を示し, オープンワールド環境における単一センサ3D再構成のための新しい標準を策定する。
論文参考訳（メタデータ） (2025-05-17T08:46:29Z)
Gaussian Object Carver: Object-Compositional Gaussian Splatting with surfaces completion [16.379647695019308]
3Dシーンの再構築はコンピュータビジョンの基本的な問題である。本稿では,Gaussian Object Carver (GOC)を紹介した。 GOCは、高品質で柔軟な再構築を実現するために、モノクラー幾何学の先行と多視点幾何学の正規化に富んだ3Dガウススプラッティング(GS)を利用する。
論文参考訳（メタデータ） (2024-12-03T01:34:39Z)
OpenMaterial: A Large-scale Dataset of Complex Materials for 3D Reconstruction [55.052637670485716]
材料認識型3D再構成のための大規模半合成データセットであるOpenMaterialを紹介する。導体、誘電体、プラスチックを含む295の異なる材料にまたがる1,001の物体と、その粗い変種が含まれ、714の異なる照明条件下で捕獲される。マルチビュー画像、3D形状モデル、カメラポーズ、深度マップ、およびオブジェクトマスクを提供し、挑戦的な材料上で3D再構成を評価するための最初の広範囲なベンチマークを確立する。
論文参考訳（メタデータ） (2024-06-13T07:46:17Z)
Total-Decom: Decomposed 3D Scene Reconstruction with Minimal Interaction [51.3632308129838]
人間のインタラクションを最小限に抑えた3次元再構成法であるTotal-Decomを提案する。提案手法は,Segment Anything Model (SAM) とハイブリッド型暗黙的なニューラルサーフェス表現をシームレスに統合し,メッシュベースの領域成長技術を用いて正確な3次元オブジェクト分解を行う。提案手法をベンチマークデータセット上で広範囲に評価し,アニメーションやシーン編集などの下流アプリケーションの可能性を示す。
論文参考訳（メタデータ） (2024-03-28T11:12:33Z)
Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文参考訳（メタデータ） (2024-03-21T17:59:59Z)
Learning Unsupervised Hierarchical Part Decomposition of 3D Objects from a Single RGB Image [102.44347847154867]
プリミティブの集合として3次元オブジェクトの幾何を共同で復元できる新しい定式化を提案する。我々のモデルは、プリミティブのバイナリツリーの形で、様々なオブジェクトの高レベルな構造的分解を復元する。 ShapeNet と D-FAUST のデータセットを用いた実験により,部品の組織化を考慮すれば3次元形状の推論が容易になることが示された。
論文参考訳（メタデータ） (2020-04-02T17:58:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。