論文の概要: GenRecon: Bridging Generative Priors for Multi-View 3D Scene Reconstruction
- arxiv url: http://arxiv.org/abs/2605.23888v1
- Date: Fri, 22 May 2026 17:49:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.455811
- Title: GenRecon: Bridging Generative Priors for Multi-View 3D Scene Reconstruction
- Title(参考訳): GenRecon: マルチビュー3Dシーン再構築のためのブリッジ生成優先事項
- Authors: Katharina Schmid, Nicolas von Lützow, Jozef Hladký, Angela Dai, Matthias Nießner,
- Abstract要約: マルチビューRGB画像から高忠実度3Dシーンを再現する手法を提案する。
シーン再構成を条件付き3次元生成として,空間的局所化,重なり合うチャンクの集合に配置した。
切刃再建法を16%上回る高忠実度結果を得た。
- 参考スコア(独自算出の注目度): 69.35136600319714
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce a new approach to high-fidelity 3D scene reconstruction from multi-view RGB images that tightly couples reconstruction with a strong generative 3D prior. We cast scene reconstruction as conditional 3D generation over a set of spatially-localized, overlapping chunks that together tile the scene, scaling generation to large scene extents. Crucially, we inherit the fidelity and completeness of state-of-the-art generative shape models -- we use Trellis.2 as an example -- which we generalize to the scene level. To this end, we propose a projection-based conditioning mechanism that lifts posed multi-view image features into a coherent 3D representation aligned with the generative model, independent of view ordering and spatially anchored to the scene, yielding high-fidelity, multi-view consistent generated geometry. This enables lifting the strong object-level prior of Trellis.2 to multi-view, scene-scale generation, producing faithful, editable PBR mesh reconstructions of indoor environments. As a result, we obtain high-fidelity results that outperform cutting-edge reconstruction methods by 16%.
- Abstract(参考訳): 多視点RGB画像から高忠実度3Dシーン再構成への新たなアプローチを提案する。
空間的局所化された重なり合うチャンクの集合にシーン再構成を条件付き3次元生成としてキャストし、シーンをタイル状にし、大きなシーン範囲に拡大する。
重要なことに、私たちは最先端の生成形状モデルの忠実さと完全さを継承します -- Trellis.2 を例として使用します -- シーンレベルに一般化しています。
そこで本研究では,多視点画像の特徴を生成モデルに整合したコヒーレントな3次元表現に引き上げるプロジェクションベース条件付け機構を提案する。
これにより、Trellis.2より前の強力なオブジェクトレベルをマルチビュー、シーンスケールで生成し、忠実で編集可能な屋内環境のPBRメッシュ再構築を可能にする。
その結果, 切削工法を16%上回る高忠実度化が得られた。
関連論文リスト
- DecoRec: Decomposed 3D Scene Reconstruction from Single-View Images via Object-Level Diffusion [65.65756111062005]
textitDecoRecは、単一のビュー2D画像を分解された3Dシーンメッシュに高めるように設計されたシステムである。
以上の結果から,DecoRecはジオメトリと新規合成の両面において,高品質なワンビューシーン再構築を促進することが示唆された。
論文 参考訳(メタデータ) (2026-05-16T04:23:48Z) - Stepper: Stepwise Immersive Scene Generation with Multiview Panoramas [101.58587238272462]
テキスト駆動型没入型3Dシーン合成のための統合フレームワークであるStepperを提案する。
Stepperは新しい大規模なマルチビューパノラマデータセットでトレーニングされている。
最先端の忠実さと構造的な一貫性を実現し、以前のアプローチよりも優れています。
論文 参考訳(メタデータ) (2026-03-30T20:26:28Z) - Gen3R: 3D Scene Generation Meets Feed-Forward Reconstruction [28.19356197940266]
Gen3RはRGBビデオとカメラポーズ、深度マップ、グローバルポイントクラウドを含む対応する3D幾何学の両方を生成する。
本手法は, 再生先を活用すれば, 復元の堅牢性を高めることができる。
論文 参考訳(メタデータ) (2026-01-07T16:57:30Z) - Towards Geometric and Textural Consistency 3D Scene Generation via Single Image-guided Model Generation and Layout Optimization [14.673302810271219]
幾何学的表現と高品質なテクスチャ情報を用いた3次元シーン生成のための新しい3段階フレームワークを提案する。
提案手法は, 個々の3次元モデルの幾何学的精度とテクスチャ忠実度の観点から, 最先端の手法よりも優れているだけでなく, シーンレイアウト合成において大きな利点がある。
論文 参考訳(メタデータ) (2025-07-20T06:59:42Z) - MUSt3R: Multi-view Network for Stereo 3D Reconstruction [11.61182864709518]
本稿では,DUSt3Rのペアから複数のビューへの拡張を提案する。
計算複雑性を低減できる多層メモリ機構でモデルを拡張します。
このフレームワークは、オフラインとオンラインの両方で3D再構成を実行するように設計されているため、SfMとビジュアルSLAMシナリオにシームレスに適用できる。
論文 参考訳(メタデータ) (2025-03-03T15:36:07Z) - BloomScene: Lightweight Structured 3D Gaussian Splatting for Crossmodal Scene Generation [54.12899218104669]
3Dシーンは非常に複雑な構造を持ち、出力が密度が高く、一貫性があり、必要な全ての構造を含むことを保証する必要がある。
現在の3Dシーン生成法は、事前訓練されたテキスト・画像拡散モデルと単眼深度推定器に依存している。
クロスモーダルシーン生成のための軽量な3次元ガウススプラッティングであるBloomSceneを提案する。
論文 参考訳(メタデータ) (2025-01-15T11:33:34Z) - 3D-SceneDreamer: Text-Driven 3D-Consistent Scene Generation [51.64796781728106]
本稿では,2次元拡散モデル以前の自然画像と,現在のシーンのグローバルな3次元情報を利用して,高品質で新しいコンテンツを合成する生成的精細化ネットワークを提案する。
提案手法は,視覚的品質と3次元の整合性を改善した多種多様なシーン生成と任意のカメラトラジェクトリをサポートする。
論文 参考訳(メタデータ) (2024-03-14T14:31:22Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。