論文の概要: DreamAnywhere: Object-Centric Panoramic 3D Scene Generation
- arxiv url: http://arxiv.org/abs/2506.20367v1
- Date: Wed, 25 Jun 2025 12:30:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.732908
- Title: DreamAnywhere: Object-Centric Panoramic 3D Scene Generation
- Title(参考訳): DreamAnywhere:オブジェクト中心パノラマ3Dシーン生成
- Authors: Edoardo Alberto Dominici, Jozef Hladky, Floor Verhoeven, Lukas Radl, Thomas Deixelberger, Stefan Ainetter, Philipp Drescher, Stefan Hauswiesner, Arno Coomans, Giacomo Nazzaro, Konstantinos Vardis, Markus Steinberger,
- Abstract要約: 私たちはDreamAnywhereを紹介します。3Dシーンの高速生成とプロトタイピングのためのモジュールシステムです。
我々のシステムは没入型ナビゲーションと直感的なオブジェクトレベルの編集をサポートし、シーン探索、視覚モックアップ、ラピッドプロトタイピングに最適である。
現在の最先端のテキストや画像に基づく3Dシーン生成手法と比較して、DreamAnywhereは、新しいビュー合成におけるコヒーレンスを大幅に改善し、競争力のある画像品質を実現する。
- 参考スコア(独自算出の注目度): 7.118837433208326
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in text-to-3D scene generation have demonstrated significant potential to transform content creation across multiple industries. Although the research community has made impressive progress in addressing the challenges of this complex task, existing methods often generate environments that are only front-facing, lack visual fidelity, exhibit limited scene understanding, and are typically fine-tuned for either indoor or outdoor settings. In this work, we address these issues and propose DreamAnywhere, a modular system for the fast generation and prototyping of 3D scenes. Our system synthesizes a 360{\deg} panoramic image from text, decomposes it into background and objects, constructs a complete 3D representation through hybrid inpainting, and lifts object masks to detailed 3D objects that are placed in the virtual environment. DreamAnywhere supports immersive navigation and intuitive object-level editing, making it ideal for scene exploration, visual mock-ups, and rapid prototyping -- all with minimal manual modeling. These features make our system particularly suitable for low-budget movie production, enabling quick iteration on scene layout and visual tone without the overhead of traditional 3D workflows. Our modular pipeline is highly customizable as it allows components to be replaced independently. Compared to current state-of-the-art text and image-based 3D scene generation approaches, DreamAnywhere shows significant improvements in coherence in novel view synthesis and achieves competitive image quality, demonstrating its effectiveness across diverse and challenging scenarios. A comprehensive user study demonstrates a clear preference for our method over existing approaches, validating both its technical robustness and practical usefulness.
- Abstract(参考訳): テキストから3Dのシーン生成の最近の進歩は、複数の産業にまたがってコンテンツ制作を変革する大きな可能性を示唆している。
研究コミュニティは、この複雑なタスクの課題に対処する際、驚くべき進歩を遂げてきたが、既存の手法はしばしば、正面のみの環境を生成し、視覚的忠実さが欠如し、シーンの理解が限られており、通常、屋内または屋外の環境で微調整されている。
本研究では,これらの課題に対処し,3Dシーンの高速生成とプロトタイピングのためのモジュールシステムであるDreamAnywhereを提案する。
本システムでは,テキストから360{\deg}パノラマ画像を合成し,背景とオブジェクトに分解し,ハイブリッド塗布による完全な3D表現を構築し,仮想環境に配置された詳細な3Dオブジェクトにオブジェクトマスクを持ち上げる。
DreamAnywhereは没入型ナビゲーションと直感的なオブジェクトレベルの編集をサポートし、シーン探索、ビジュアルモックアップ、ラピッドプロトタイピングに理想的だ。
これらの特徴により、従来の3Dワークフローのオーバーヘッドを伴わずに、シーンレイアウトと視覚的トーンの迅速な反復を可能にする、低予算映画製作に特に適している。
モジュールパイプラインは、コンポーネントを独立して置き換えることができるため、非常にカスタマイズ可能です。
現在の最先端のテキストや画像ベースの3Dシーン生成アプローチと比較して、DreamAnywhereは、新しいビュー合成におけるコヒーレンスを大幅に改善し、競争力のある画像品質を実現し、多様な、挑戦的なシナリオでその効果を実証している。
包括的ユーザスタディでは、既存のアプローチよりもメソッドの明確な好みを示し、その技術的堅牢性と実用性の両方を検証している。
関連論文リスト
- Video Perception Models for 3D Scene Synthesis [109.5543506037003]
VIPSceneは、ビデオ生成モデルにおける3D物理世界のエンコードされたコモンセンス知識を利用する新しいフレームワークである。
VIPSceneはビデオ生成、フィードフォワード3D再構成、オープン語彙認識モデルをシームレスに統合し、シーン内の各オブジェクトを意味的かつ幾何学的に分析する。
論文 参考訳(メタデータ) (2025-06-25T16:40:17Z) - Visibility-Uncertainty-guided 3D Gaussian Inpainting via Scene Conceptional Learning [63.94919846010485]
3DGI)は、複数の入力ビューから補完的な視覚的・意味的手がかりを効果的に活用することが困難である。
本稿では,異なる入力ビュー間での3Dポイントの視認性不確実性を計測し,それらを用いて3DGIを誘導する手法を提案する。
ViSibility-uncerTainty-guided 3DGIとシーンコンセプトAl学習を統合し,新しい3DGIフレームワークであるVISTAを構築した。
論文 参考訳(メタデータ) (2025-04-23T06:21:11Z) - HiScene: Creating Hierarchical 3D Scenes with Isometric View Generation [50.206100327643284]
HiSceneは、2D画像生成と3Dオブジェクト生成のギャップを埋める新しい階層的なフレームワークである。
構成構造を維持しながら2次元表現に整合した3次元コンテンツを生成する。
論文 参考訳(メタデータ) (2025-04-17T16:33:39Z) - SceneCraft: Layout-Guided 3D Scene Generation [29.713491313796084]
シーンクラフト(SceneCraft)は、テキスト記述や空間的レイアウトの好みに則った、室内の詳細なシーンを生成する新しい方法である。
本手法は,多様なテクスチャ,一貫した幾何,現実的な視覚的品質を有する複雑な屋内シーン生成において,既存のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2024-10-11T17:59:58Z) - HoloDreamer: Holistic 3D Panoramic World Generation from Text Descriptions [31.342899807980654]
3Dシーン生成は、仮想現実、ゲーム、映画産業など、さまざまな領域で高い需要がある。
フル3Dシーンの全体的初期化として,最初に高精細パノラマを生成するフレームワークであるHoloDreamerを紹介する。
そして、3Dガウススティング(3D-GS)を活用して3Dシーンを迅速に再構築し、ビュー一貫性と完全に囲まれた3Dシーンの作成を容易にする。
論文 参考訳(メタデータ) (2024-07-21T14:52:51Z) - 3D-SceneDreamer: Text-Driven 3D-Consistent Scene Generation [51.64796781728106]
本稿では,2次元拡散モデル以前の自然画像と,現在のシーンのグローバルな3次元情報を利用して,高品質で新しいコンテンツを合成する生成的精細化ネットワークを提案する。
提案手法は,視覚的品質と3次元の整合性を改善した多種多様なシーン生成と任意のカメラトラジェクトリをサポートする。
論文 参考訳(メタデータ) (2024-03-14T14:31:22Z) - Style-Consistent 3D Indoor Scene Synthesis with Decoupled Objects [84.45345829270626]
制御可能な3D屋内シーン合成は、技術進歩の最前線にある。
シーンスタイリングの現在の手法は、シーン全体にスタイルを適用することに限定されている。
室内3Dシーンを合成するためのユニークなパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-24T03:10:36Z) - SceneWiz3D: Towards Text-guided 3D Scene Composition [134.71933134180782]
既存のアプローチでは、大規模なテキスト・ツー・イメージモデルを使用して3D表現を最適化するか、オブジェクト中心のデータセット上で3Dジェネレータをトレーニングする。
テキストから高忠実度3Dシーンを合成する新しい手法であるSceneWiz3Dを紹介する。
論文 参考訳(メタデータ) (2023-12-13T18:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。