論文の概要: RoomCraft: Controllable and Complete 3D Indoor Scene Generation
- arxiv url: http://arxiv.org/abs/2506.22291v1
- Date: Fri, 27 Jun 2025 15:03:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.2491
- Title: RoomCraft: Controllable and Complete 3D Indoor Scene Generation
- Title(参考訳): RoomCraft:コントロール可能で完全な3D室内シーン生成
- Authors: Mengqi Zhou, Xipeng Wang, Yuxi Wang, Zhaoxiang Zhang,
- Abstract要約: RoomCraftは、実際の画像、スケッチ、テキスト記述をコヒーレントな3D屋内シーンに変換するマルチステージパイプラインである。
このアプローチでは,シーン生成パイプラインと制約駆動最適化フレームワークを組み合わせる。
RoomCraftは、リアルでセマンティックなコヒーレントで視覚的に魅力的な部屋レイアウトを生成する上で、既存の方法よりもはるかに優れています。
- 参考スコア(独自算出の注目度): 51.19602078504066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating realistic 3D indoor scenes from user inputs remains a challenging problem in computer vision and graphics, requiring careful balance of geometric consistency, spatial relationships, and visual realism. While neural generation methods often produce repetitive elements due to limited global spatial reasoning, procedural approaches can leverage constraints for controllable generation but struggle with multi-constraint scenarios. When constraints become numerous, object collisions frequently occur, forcing the removal of furniture items and compromising layout completeness. To address these limitations, we propose RoomCraft, a multi-stage pipeline that converts real images, sketches, or text descriptions into coherent 3D indoor scenes. Our approach combines a scene generation pipeline with a constraint-driven optimization framework. The pipeline first extracts high-level scene information from user inputs and organizes it into a structured format containing room type, furniture items, and spatial relations. It then constructs a spatial relationship network to represent furniture arrangements and generates an optimized placement sequence using a heuristic-based depth-first search (HDFS) algorithm to ensure layout coherence. To handle complex multi-constraint scenarios, we introduce a unified constraint representation that processes both formal specifications and natural language inputs, enabling flexible constraint-oriented adjustments through a comprehensive action space design. Additionally, we propose a Conflict-Aware Positioning Strategy (CAPS) that dynamically adjusts placement weights to minimize furniture collisions and ensure layout completeness. Extensive experiments demonstrate that RoomCraft significantly outperforms existing methods in generating realistic, semantically coherent, and visually appealing room layouts across diverse input modalities.
- Abstract(参考訳): ユーザ入力からリアルな3D屋内シーンを生成することは、コンピュータビジョンとグラフィックスにおいて難しい問題であり、幾何的一貫性、空間関係、視覚リアリズムの慎重にバランスを取る必要がある。
ニューラルジェネレーション法は、大域的空間的推論の制限により繰り返し要素を生成することが多いが、手続き的アプローチは制御可能な生成の制約を利用することができるが、マルチ制約シナリオに苦しむことができる。
制約が多くなると、オブジェクトの衝突が頻発し、家具の取り外しやレイアウトの完全性を損なう。
この制限に対処するため,実際の画像やスケッチ,テキスト記述をコヒーレントな3D屋内シーンに変換するマルチステージパイプラインであるRoomCraftを提案する。
このアプローチでは,シーン生成パイプラインと制約駆動最適化フレームワークを組み合わせる。
パイプラインは、まず、ユーザ入力から高レベルのシーン情報を抽出し、ルームタイプ、家具アイテム、空間関係を含む構造化形式に整理する。
次に、家具配置を表す空間関係ネットワークを構築し、ヒューリスティックに基づく深さ優先探索(HDFS)アルゴリズムを用いて最適化された配置シーケンスを生成し、レイアウトコヒーレンスを確保する。
複雑なマルチ制約シナリオを扱うために,形式仕様と自然言語入力の両方を処理する統一制約表現を導入し,包括的なアクション空間設計を通じて柔軟な制約指向の調整を可能にする。
さらに,家具の衝突を最小限に抑え,レイアウトの完全性を確保するため,配置重みを動的に調整するCAPS(Conflict-Aware Positioning Strategy)を提案する。
大規模な実験により、RoomCraftは、様々な入力モダリティにまたがって、現実的でセマンティックに一貫性があり、視覚的に魅力的な部屋レイアウトを生成するのに、既存の手法を著しく上回ります。
関連論文リスト
- Direct Numerical Layout Generation for 3D Indoor Scene Synthesis via Spatial Reasoning [27.872834485482276]
3D屋内シーン合成は、AIとデジタルコンテンツ作成の具体化に不可欠である。
既存のメソッドは、オープン語彙であり、きめ細かいユーザー指示に一致したシーンを生成するのに失敗する。
テキスト記述から数値的な3Dレイアウトを直接生成するフレームワークであるDirectを導入する。
論文 参考訳(メタデータ) (2025-06-05T17:59:42Z) - HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation [50.206100327643284]
HiSceneは、2D画像生成と3Dオブジェクト生成のギャップを埋める新しい階層的なフレームワークである。
構成構造を維持しながら2次元表現に整合した3次元コンテンツを生成する。
論文 参考訳(メタデータ) (2025-04-17T16:33:39Z) - DeBaRA: Denoising-Based 3D Room Arrangement Generation [22.96293773013579]
有界環境における正確で制御可能で柔軟なアレンジメント生成に適したスコアベースモデルであるDeBaRAを紹介する。
本研究では,オブジェクトの空間特性に着目して,シーン合成や完了,再配置など,複数のダウンストリームアプリケーションを実行するために,単一トレーニングされたDeBaRAモデルをテスト時に活用できることを実証する。
論文 参考訳(メタデータ) (2024-09-26T23:18:25Z) - Mixed Diffusion for 3D Indoor Scene Synthesis [55.94569112629208]
提案するMiDiffusionは,可塑性3次元屋内シーンを合成するための混合離散連続拡散モデルである。
床条件の3次元シーン合成において,最先端の自己回帰モデルおよび拡散モデルより優れることを示す。
論文 参考訳(メタデータ) (2024-05-31T17:54:52Z) - Style-Consistent 3D Indoor Scene Synthesis with Decoupled Objects [84.45345829270626]
制御可能な3D屋内シーン合成は、技術進歩の最前線にある。
シーンスタイリングの現在の手法は、シーン全体にスタイルを適用することに限定されている。
室内3Dシーンを合成するためのユニークなパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-24T03:10:36Z) - CommonScenes: Generating Commonsense 3D Indoor Scenes with Scene Graph
Diffusion [83.30168660888913]
シーングラフを対応する制御可能な3Dシーンに変換する完全生成モデルであるCommonScenesを提案する。
パイプラインは2つのブランチで構成されており、1つは変分オートエンコーダでシーン全体のレイアウトを予測し、もう1つは互換性のある形状を生成する。
生成されたシーンは、入力シーングラフを編集し、拡散モデルのノイズをサンプリングすることで操作することができる。
論文 参考訳(メタデータ) (2023-05-25T17:39:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。