Fugu-MT 論文翻訳(概要): WonderWorld: Interactive 3D Scene Generation from a Single Image

論文の概要: WonderWorld: Interactive 3D Scene Generation from a Single Image

arxiv url: http://arxiv.org/abs/2406.09394v3
Date: Tue, 10 Sep 2024 17:54:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-11 22:52:03.566868
Title: WonderWorld: Interactive 3D Scene Generation from a Single Image
Title（参考訳）: ワンダーワールド:1枚の画像からインタラクティブな3Dシーン生成
Authors: Hong-Xing Yu, Haoyi Duan, Charles Herrmann, William T. Freeman, Jiajun Wu,
Abstract要約: 我々はインタラクティブな3Dシーン生成のための新しいフレームワークWonderWorldを紹介する。 WonderWorldは、単一のA6000 GPU上で10秒未満で接続された多様な3Dシーンを生成する。
参考スコア（独自算出の注目度）: 38.83667648993784
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present WonderWorld, a novel framework for interactive 3D scene generation that enables users to interactively specify scene contents and layout and see the created scenes in low latency. The major challenge lies in achieving fast generation of 3D scenes. Existing scene generation approaches fall short of speed as they often require (1) progressively generating many views and depth maps, and (2) time-consuming optimization of the scene geometry representations. We introduce the Fast Layered Gaussian Surfels (FLAGS) as our scene representation and an algorithm to generate it from a single view. Our approach does not need multiple views, and it leverages a geometry-based initialization that significantly reduces optimization time. Another challenge is generating coherent geometry that allows all scenes to be connected. We introduce the guided depth diffusion that allows partial conditioning of depth estimation. WonderWorld generates connected and diverse 3D scenes in less than 10 seconds on a single A6000 GPU, enabling real-time user interaction and exploration. We demonstrate the potential of WonderWorld for user-driven content creation and exploration in virtual environments. We will release full code and software for reproducibility. Project website: https://kovenyu.com/WonderWorld/.
Abstract（参考訳）: 我々は,インタラクティブな3Dシーン生成のための新しいフレームワークであるWonderWorldを紹介した。最大の課題は、3Dシーンを高速に生成することである。既存のシーン生成手法は,(1)多くのビューや深度マップを段階的に生成し,(2)シーン幾何学表現の時間を要する最適化を行う。我々は,FLAGS(Fast Layered Gaussian Surfels)をシーン表現として紹介し,それを単一ビューから生成するアルゴリズムを提案する。提案手法は複数のビューを必要としないため,最適化時間を大幅に短縮する幾何ベースの初期化を利用する。もうひとつの課題は、すべてのシーンを接続するコヒーレントな幾何学を生成することだ。本稿では,深度推定の部分的条件付けを可能にするガイド付き深度拡散法を提案する。 WonderWorldは、1つのA6000 GPU上で10秒未満で接続された多様な3Dシーンを生成し、リアルタイムのユーザインタラクションと探索を可能にする。仮想環境におけるユーザ主導型コンテンツ作成と探索におけるWonderWorldの可能性を示す。再現性のための完全なコードとソフトウェアをリリースします。プロジェクトWebサイト: https://kovenyu.com/WonderWorld/.com

関連論文リスト

Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation [66.95956271144982]
本稿では,単一画像から一貫した3Dポイントクラウドシーケンスを生成する新しいビデオ拡散フレームワークであるVoyagerを紹介する。既存のアプローチとは異なり、Voyagerはフレーム間で固有の一貫性を持って、エンドツーエンドのシーン生成と再構築を実現している。
論文参考訳（メタデータ） (2025-06-04T17:59:04Z)
WorldExplorer: Towards Generating Fully Navigable 3D Scenes [49.21733308718443]
WorldExplorerは、幅広い視点で一貫した視覚的品質で、完全にナビゲート可能な3Dシーンを構築する。私たちは、シーンを深く探求する、短く定義された軌道に沿って、複数のビデオを生成します。我々の新しいシーン記憶は、各ビデオが最も関連性の高い先行ビューで条件付けされている一方、衝突検出機構は劣化を防止している。
論文参考訳（メタデータ） (2025-06-02T15:41:31Z)
WonderTurbo: Generating Interactive 3D World in 0.72 Seconds [29.61066704266084]
我々は,0.72秒以内で3Dシーンの新たな視点を生成できる,初めてのリアルタイムインタラクティブな3Dシーン生成フレームワークであるWonderTurboを紹介する。具体的には、WonderTurboは幾何学的および外見的モデリングの両方を3Dシーン生成で高速化する。
論文参考訳（メタデータ） (2025-04-03T04:10:47Z)
WorldPrompter: Traversable Text-to-Scene Generation [18.405299478122693]
テキストプロンプトから可逆3Dシーンを合成するための新しい生成パイプラインであるWorldPrompterを紹介する。 WorldPrompterには条件付き360度パノラマビデオジェネレータが組み込まれており、仮想環境を歩いたり捉えたりする人をシミュレートする128フレームのビデオを生成することができる。得られたビデオは、高速フィードフォワード3Dコンストラクタによってガウススプラッターとして再構成され、3Dシーン内で真の歩行可能な体験を可能にする。
論文参考訳（メタデータ） (2025-04-02T18:04:32Z)
SceneCraft: Layout-Guided 3D Scene Generation [29.713491313796084]
シーンクラフト(SceneCraft)は、テキスト記述や空間的レイアウトの好みに則った、室内の詳細なシーンを生成する新しい方法である。本手法は,多様なテクスチャ,一貫した幾何,現実的な視覚的品質を有する複雑な屋内シーン生成において,既存のアプローチを著しく上回っている。
論文参考訳（メタデータ） (2024-10-11T17:59:58Z)
SceneDreamer360: Text-Driven 3D-Consistent Scene Generation with Panoramic Gaussian Splatting [53.32467009064287]
テキスト駆動型3D一貫性シーン生成モデルSceneDreamer360を提案する。提案手法は,テキスト駆動パノラマ画像生成モデルを3次元シーン生成の先行モデルとして活用する。 SceneDreamer360はそのパノラマ画像生成と3DGSにより、より高品質で空間的に整合性があり、視覚的に魅力的な3Dシーンを任意のテキストプロンプトから生成できることを示した。
論文参考訳（メタデータ） (2024-08-25T02:56:26Z)
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation [105.52153675890408]
3D没入型シーン生成はコンピュータビジョンとグラフィックスにおいて難しいが重要な課題である。 LayerPano3Dは、単一のテキストプロンプトからフルビューで探索可能なパノラマ3Dシーンを生成するための新しいフレームワークである。
論文参考訳（メタデータ） (2024-08-23T17:50:23Z)
Sketch2Scene: Automatic Generation of Interactive 3D Game Scenes from User's Casual Sketches [50.51643519253066]
3Dコンテンツ生成は、ビデオゲーム、映画制作、バーチャルおよび拡張現実など、多くのコンピュータグラフィックスアプリケーションの中心にある。本稿では,インタラクティブでプレイ可能な3Dゲームシーンを自動的に生成するための,新しいディープラーニングベースのアプローチを提案する。
論文参考訳（メタデータ） (2024-08-08T16:27:37Z)
OSN: Infinite Representations of Dynamic 3D Scenes from Monocular Videos [7.616167860385134]
モノクラーRGBビデオから基礎となる動的3Dシーンの表現を復元することは、長い間困難であった。我々はOSNと呼ばれる新しいフレームワークを導入し、入力ビデオにマッチする高機能な3Dシーン構成を学習する。本手法は, きめ細かい3次元シーン形状を学習する上で, 明らかな優位性を示す。
論文参考訳（メタデータ） (2024-07-08T05:03:46Z)
FastScene: Text-Driven Fast 3D Indoor Scene Generation via Panoramic Gaussian Splatting [15.648080938815879]
高速かつ高品質な3Dシーン生成のためのフレームワークであるFastSceneを提案する。 FastSceneは15分以内に3Dシーンを生成することができる。
論文参考訳（メタデータ） (2024-05-09T13:44:16Z)
Invisible Stitch: Generating Smooth 3D Scenes with Depth Inpainting [75.7154104065613]
本稿では,3次元融合過程を学習するために,教師の蒸留と自己学習によって訓練された新しい深度補完モデルを提案する。また,地上の真理幾何に基づくシーン生成手法のベンチマーク手法も導入した。
論文参考訳（メタデータ） (2024-04-30T17:59:40Z)
DreamScene360: Unconstrained Text-to-3D Scene Generation with Panoramic Gaussian Splatting [56.101576795566324]
テキストから3D 360$circ$のシーン生成パイプラインを提示する。提案手法は, 2次元拡散モデルの生成力を利用して, 自己複製を促進する。当社の手法は,360ドル(約3万2000円)の視野内で,グローバルに一貫した3Dシーンを提供する。
論文参考訳（メタデータ） (2024-04-10T10:46:59Z)
WonderJourney: Going from Anywhere to Everywhere [75.1284367548585]
WonderJourneyは、永続的な3Dシーン生成のためのモジュール化されたフレームワークである。私たちは多様だがコヒーレントに結びついている3Dシーンの長いシリーズを旅していきます。私たちは、様々なシーンタイプやスタイルにまたがって、魅力的で多様な視覚結果を示し、想像上の「Wonderjourneys」を形成します。
論文参考訳（メタデータ） (2023-12-06T20:22:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。