Fugu-MT 論文翻訳(概要): LT3SD: Latent Trees for 3D Scene Diffusion

論文の概要: LT3SD: Latent Trees for 3D Scene Diffusion

arxiv url: http://arxiv.org/abs/2409.08215v1
Date: Thu, 12 Sep 2024 16:55:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-13 15:35:07.504594
Title: LT3SD: Latent Trees for 3D Scene Diffusion
Title（参考訳）: LT3SD:3次元シーン拡散のための潜木
Authors: Quan Meng, Lei Li, Matthias Nießner, Angela Dai,
Abstract要約: 本稿では,大規模3次元シーン生成のための新しい潜時拡散モデルLT3SDを提案する。大規模かつ高品質な非条件3Dシーン生成におけるLT3SDの有効性とメリットを実証する。
参考スコア（独自算出の注目度）: 71.91446143124648
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present LT3SD, a novel latent diffusion model for large-scale 3D scene generation. Recent advances in diffusion models have shown impressive results in 3D object generation, but are limited in spatial extent and quality when extended to 3D scenes. To generate complex and diverse 3D scene structures, we introduce a latent tree representation to effectively encode both lower-frequency geometry and higher-frequency detail in a coarse-to-fine hierarchy. We can then learn a generative diffusion process in this latent 3D scene space, modeling the latent components of a scene at each resolution level. To synthesize large-scale scenes with varying sizes, we train our diffusion model on scene patches and synthesize arbitrary-sized output 3D scenes through shared diffusion generation across multiple scene patches. Through extensive experiments, we demonstrate the efficacy and benefits of LT3SD for large-scale, high-quality unconditional 3D scene generation and for probabilistic completion for partial scene observations.
Abstract（参考訳）: 本稿では,大規模3次元シーン生成のための新しい潜時拡散モデルLT3SDを提案する。拡散モデルの最近の進歩は、3次元オブジェクト生成において顕著な結果を示しているが、3次元シーンに拡張された場合、空間的範囲と品質に制限がある。複雑で多様な3次元シーン構造を生成するために,低周波形状と高周波詳細の両方を,粗大な階層構造で効果的に符号化する潜木表現を導入する。そして、この潜伏3次元シーン空間で生成的拡散過程を学習し、各解像度レベルでシーンの潜伏成分をモデル化する。大規模シーンを様々な大きさで合成するために、シーンパッチ上で拡散モデルを訓練し、複数のシーンパッチをまたいだ共有拡散生成を通して任意の大きさの3Dシーンを合成する。大規模かつ高品質な非条件の3Dシーン生成と部分的なシーン観察のための確率的完了のためのLT3SDの有効性と利点を実証した。

関連論文リスト

Wonderland: Navigating 3D Scenes from a Single Image [43.99037613068823]
本研究では,映像拡散モデルからの潜伏分を利用した大規模再構成モデルを導入し,映像の3次元ガウススプラッティングをフィードフォワードで予測する。プログレッシブ・ラーニング・ストラテジーを用いて3次元再構成モデルをトレーニングし,高品質でワイドスコープ,ジェネリックな3次元シーンの効率的な生成を可能にする。
論文参考訳（メタデータ） (2024-12-16T18:58:17Z)
L3DG: Latent 3D Gaussian Diffusion [74.36431175937285]
L3DGは3次元ガウス拡散定式化による3次元ガウスの3次元モデリングのための最初のアプローチである。我々は、部屋の大きさのシーンで効率的に操作するために、スパース畳み込みアーキテクチャーを用いている。 3Dガウス表現を利用することで、生成されたシーンを任意の視点からリアルタイムでレンダリングすることができる。
論文参考訳（メタデータ） (2024-10-17T13:19:32Z)
LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation [73.36690511083894]
本稿では,LN3Diffと呼ばれる新しいフレームワークを導入し,統一された3次元拡散パイプラインに対処する。提案手法では,3次元アーキテクチャと変分オートエンコーダを用いて,入力画像を構造化されたコンパクトな3次元潜在空間に符号化する。 3次元生成のためのShapeNetの最先端性能を実現し,モノクロ3次元再構成と条件付き3次元生成において優れた性能を示す。
論文参考訳（メタデータ） (2024-03-18T17:54:34Z)
3D-SceneDreamer: Text-Driven 3D-Consistent Scene Generation [51.64796781728106]
本稿では,2次元拡散モデル以前の自然画像と,現在のシーンのグローバルな3次元情報を利用して,高品質で新しいコンテンツを合成する生成的精細化ネットワークを提案する。提案手法は,視覚的品質と3次元の整合性を改善した多種多様なシーン生成と任意のカメラトラジェクトリをサポートする。
論文参考訳（メタデータ） (2024-03-14T14:31:22Z)
BerfScene: Bev-conditioned Equivariant Radiance Fields for Infinite 3D Scene Generation [96.58789785954409]
本研究では,同変放射場と鳥眼視図のガイダンスを組み込んだ実用的で効率的な3次元表現を提案する。局所的なシーンを合成し、スムーズな一貫性で縫い合わせることで、大規模で無限スケールの3Dシーンを作ります。
論文参考訳（メタデータ） (2023-12-04T18:56:10Z)
Pyramid Diffusion for Fine 3D Large Scene Generation [56.00726092690535]
拡散モデルは2次元画像と小型3次元オブジェクトの生成において顕著な結果を示した。大規模な3Dシーンの合成への応用はめったに研究されていない。本稿では,大規模拡散モデルを用いて,高品質な屋外シーンを段階的に生成するフレームワークであるPraamid Discrete Diffusion Model (PDD)を紹介する。
論文参考訳（メタデータ） (2023-11-20T11:24:21Z)
3inGAN: Learning a 3D Generative Model from Images of a Self-similar Scene [34.2144933185175]
3inGANは、単一の自己相似3Dシーンの2D画像から訓練された無条件3D生成モデルである。実地および合成源から得られた,様々なスケールと複雑さの半確率的な場面での結果を示す。
論文参考訳（メタデータ） (2022-11-27T18:03:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。