論文の概要: HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild
- arxiv url: http://arxiv.org/abs/2512.02450v1
- Date: Tue, 02 Dec 2025 06:18:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 21:04:45.742748
- Title: HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild
- Title(参考訳): HouseLayout3D: 野生における3Dレイアウト推定のためのベンチマークとトレーニングフリーベースライン
- Authors: Valentin Bieri, Marie-Julie Rakotosaona, Keisuke Tateno, Francis Engelmann, Leonidas Guibas,
- Abstract要約: 現在の3Dレイアウト推定モデルは、主に単純な1室または1フロア環境を含む合成データセットに基づいて訓練されている。
実世界のベンチマークであるHouse3Dを導入する。
- 参考スコア(独自算出の注目度): 17.263404264950257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current 3D layout estimation models are primarily trained on synthetic datasets containing simple single room or single floor environments. As a consequence, they cannot natively handle large multi floor buildings and require scenes to be split into individual floors before processing, which removes global spatial context that is essential for reasoning about structures such as staircases that connect multiple levels. In this work, we introduce HouseLayout3D, a real world benchmark designed to support progress toward full building scale layout estimation, including multiple floors and architecturally intricate spaces. We also present MultiFloor3D, a simple training free baseline that leverages recent scene understanding methods and already outperforms existing 3D layout estimation models on both our benchmark and prior datasets, highlighting the need for further research in this direction. Data and code are available at: https://houselayout3d.github.io.
- Abstract(参考訳): 現在の3Dレイアウト推定モデルは、主に単純な1室または1フロア環境を含む合成データセットに基づいて訓練されている。
結果として、大きなマルチフロアの建物をネイティブに扱うことができず、処理前に個々のフロアに分割する必要がある。
本研究では,複数のフロアや建築上の複雑な空間を含む,フルスケールのレイアウト推定に向けた進展を支援するために設計された実世界のベンチマークであるHouseLayout3Dを紹介する。
我々はまた、MultiFloor3Dという、最近のシーン理解手法を活用し、我々のベンチマークと以前のデータセットの両方で既存の3Dレイアウト推定モデルより優れており、この方向のさらなる研究の必要性を強調している。
データとコードは、https://houselayout3d.github.io.comで入手できる。
関連論文リスト
- M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation [14.956470298543534]
テキスト駆動の3Dシーン生成では、オブジェクトレイアウトは、高レベルの言語命令を詳細な出力でブリッジする重要な中間表現として機能する。
3次元屋内レイアウト生成のための大規模マルチソースデータセットであるM3Dを紹介する。
M3Dは15,080のレイアウトと258k以上のオブジェクトインスタンスで構成され、現実世界のスキャン、プロのCADデザイン、手続き的に生成されたシーンを統合している。
論文 参考訳(メタデータ) (2025-09-28T08:16:08Z) - Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning [30.400355766831307]
3D屋内シーン合成は、AIとデジタルコンテンツ作成の具体化に不可欠である。
既存のメソッドは、オープン語彙であり、きめ細かいユーザー指示に一致したシーンを生成するのに失敗する。
テキスト記述から数値的な3Dレイアウトを直接生成するフレームワークであるDirectを導入する。
論文 参考訳(メタデータ) (2025-06-05T17:59:42Z) - SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining [100.23919762298227]
現在、既存のすべてのメソッドは、トレーニング中や推論時に2Dまたはテキストのモダリティに依存している。
我々はSceneSplatを紹介し,3DGSで動作する最初の大規模屋内シーン理解手法について紹介する。
ラベルのないシーンからリッチな3D特徴学習を解放する自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2025-03-23T12:50:25Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - SGAligner : 3D Scene Alignment with Scene Graphs [84.01002998166145]
3Dシーングラフの構築は、いくつかの具体的AIアプリケーションのためのシーン表現のトピックとして登場した。
オーバーラップ可能な3次元シーングラフのペアをゼロから部分的に整列させるという基本的な問題に着目する。
そこで我々はSGAlignerを提案する。SGAlignerは3次元シーングラフのペアを組合わせるための最初の方法であり、その組込みシナリオに対して堅牢である。
論文 参考訳(メタデータ) (2023-04-28T14:39:22Z) - Neural 3D Scene Reconstruction with the Manhattan-world Assumption [58.90559966227361]
本稿では,多視点画像から3次元屋内シーンを再構築する課題について述べる。
平面的制約は、最近の暗黙の神経表現に基づく再構成手法に便利に組み込むことができる。
提案手法は, 従来の手法よりも3次元再構成品質に優れていた。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Roominoes: Generating Novel 3D Floor Plans From Existing 3D Rooms [22.188206636953794]
既存の3D部屋から新しい3Dフロアプランを作成するタスクを提案する。
1つは利用可能な2Dフロアプランを使用して、3Dルームの選択と変形をガイドし、もう1つは互換性のある3Dルームのセットを取得し、それらを新しいレイアウトに組み合わせることを学ぶ。
論文 参考訳(メタデータ) (2021-12-10T16:17:01Z) - Scan2Plan: Efficient Floorplan Generation from 3D Scans of Indoor Scenes [9.71137838903781]
Scan2Planは,室内環境の構造要素の3次元スキャンから,フロアプランを正確に推定するための新しい手法である。
提案手法は、初期ステージがシーンの無秩序な点雲をクラスタリングする2段階のアプローチを取り入れたものである。
その後の段階では、各部屋について単純なポリゴンによってパラメータ化された閉周を推定する。
最後のフロアプランは、グローバル・コーディネート・システムにおけるすべての部屋周計の集合である。
論文 参考訳(メタデータ) (2020-03-16T17:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。