論文の概要: Turbo3D: Ultra-fast Text-to-3D Generation
- arxiv url: http://arxiv.org/abs/2412.04470v1
- Date: Thu, 05 Dec 2024 18:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-06 14:40:20.679247
- Title: Turbo3D: Ultra-fast Text-to-3D Generation
- Title(参考訳): Turbo3D:超高速テキストから3D生成
- Authors: Hanzhe Hu, Tianwei Yin, Fujun Luan, Yiwei Hu, Hao Tan, Zexiang Xu, Sai Bi, Shubham Tulsiani, Kai Zhang,
- Abstract要約: Turbo3Dは、高品質なガウススプラッティング資産を1秒未満で生成できる超高速テキスト・ツー・3Dシステムである。
ターボ3Dは、4段階の高速な4ビュー拡散発生器と効率的なフィードフォワードガウス再構成器を採用している。
提案手法は, 従来のベースラインよりも優れた3次元生成結果を示すとともに, ランタイムのごく一部で動作することを示す。
- 参考スコア(独自算出の注目度): 49.47034935212807
- License:
- Abstract: We present Turbo3D, an ultra-fast text-to-3D system capable of generating high-quality Gaussian splatting assets in under one second. Turbo3D employs a rapid 4-step, 4-view diffusion generator and an efficient feed-forward Gaussian reconstructor, both operating in latent space. The 4-step, 4-view generator is a student model distilled through a novel Dual-Teacher approach, which encourages the student to learn view consistency from a multi-view teacher and photo-realism from a single-view teacher. By shifting the Gaussian reconstructor's inputs from pixel space to latent space, we eliminate the extra image decoding time and halve the transformer sequence length for maximum efficiency. Our method demonstrates superior 3D generation results compared to previous baselines, while operating in a fraction of their runtime.
- Abstract(参考訳): 高品質なガウススプラッティング資産を1秒未満で生成できる超高速テキスト・ツー・3DシステムであるTurbo3Dを提案する。
ターボ3Dは4段階の高速拡散発生器と効率の良いフィードフォワードガウス再構成器を搭載し、どちらも潜時空間で動作する。
4段階の4ビュージェネレータは、新しいDual-Teacherアプローチによって蒸留された学生モデルであり、学生は、多ビュー教師からビュー一貫性を学び、単ビュー教師からフォトリアリズムを学ぶことを奨励する。
ガウスコンストラクタの入力を画素空間から潜在空間にシフトすることにより、余分な画像復号時間を排除し、変換器のシーケンス長を最大効率で半減する。
提案手法は, 従来のベースラインよりも優れた3次元生成結果を示すとともに, ランタイムのごく一部で動作することを示す。
関連論文リスト
- Hybrid Fourier Score Distillation for Efficient One Image to 3D Object Generation [42.83810819513537]
単一の画像から3D生成は、制御可能な3D資産を作る上で重要な要素である。
2D-3Dハイブリッドフーリエスコア蒸留目標関数hy-FSDを提案する。
hy-FSDは既存の3D生成手法に統合でき、性能が大幅に向上する。
論文 参考訳(メタデータ) (2024-05-31T08:11:25Z) - STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians [36.83603109001298]
STAG4Dは、事前訓練された拡散モデルと動的3次元ガウススプラッティングを組み合わせた、高忠実度4D生成のための新しいフレームワークである。
提案手法は, レンダリング品質, 時空間整合性, 生成ロバスト性において, 先行4次元生成よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T04:16:33Z) - IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality
3D Generation [96.32684334038278]
本稿では,テキスト・ツー・3Dモデルの設計空間について検討する。
画像生成装置の代わりに映像を考慮し、マルチビュー生成を大幅に改善する。
IM-3Dは,2次元ジェネレータネットワーク10-100xの評価回数を削減する。
論文 参考訳(メタデータ) (2024-02-13T18:59:51Z) - LGM: Large Multi-View Gaussian Model for High-Resolution 3D Content
Creation [51.19871052619077]
テキストプロンプトやシングルビュー画像から高解像度の3Dモデルを生成するための新しいフレームワークであるLarge Multi-View Gaussian Model (LGM)を紹介する。
我々は,5秒以内に3Dオブジェクトを生成する高速な速度を維持しながら,トレーニング解像度を512に向上し,高解像度な3Dコンテンツ生成を実現する。
論文 参考訳(メタデータ) (2024-02-07T17:57:03Z) - DreamGaussian4D: Generative 4D Gaussian Splatting [56.49043443452339]
DG4D(DreamGaussian 4D:DreamGaussian 4D)はGaussian Splatting(GS)をベースとした効率的な4D生成フレームワークである。
我々の重要な洞察は、空間変換の明示的なモデリングと静的GSを組み合わせることで、4次元生成の効率的かつ強力な表現ができるということである。
ビデオ生成手法は、高画質の4D生成を向上し、価値ある時空間前兆を提供する可能性がある。
論文 参考訳(メタデータ) (2023-12-28T17:16:44Z) - Align Your Gaussians: Text-to-4D with Dynamic 3D Gaussians and Composed
Diffusion Models [94.07744207257653]
我々は、探索されていないテキストから4D設定に焦点をあて、動的にアニメーションされた3Dオブジェクトを合成する。
4次元オブジェクト最適化において,テキスト・ツー・イメージ,テキスト・ツー・ビデオ,および3次元認識型多視点拡散モデルを組み合わせてフィードバックを提供する。
論文 参考訳(メタデータ) (2023-12-21T11:41:02Z) - Instant3D: Fast Text-to-3D with Sparse-View Generation and Large
Reconstruction Model [68.98311213582949]
テキストプロンプトから高品質で多様な3Dアセットをフィードフォワードで生成する新しい手法であるInstant3Dを提案する。
提案手法は,従来の最適化手法よりも2桁早く,20秒以内に高画質の多種多様な3Dアセットを生成できる。
論文 参考訳(メタデータ) (2023-11-10T18:03:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。