Fugu-MT 論文翻訳(概要): GECO: Generative Image-to-3D within a SECOnd

論文の概要: GECO: Generative Image-to-3D within a SECOnd

arxiv url: http://arxiv.org/abs/2405.20327v2
Date: Tue, 20 Aug 2024 03:54:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-21 19:49:55.071775
Title: GECO: Generative Image-to-3D within a SECOnd
Title（参考訳）: GECO:SECOnd内の3D画像生成
Authors: Chen Wang, Jiatao Gu, Xiaoxiao Long, Yuan Liu, Lingjie Liu,
Abstract要約: 本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。 GECOは、前例のないレベルの効率で高品質な3Dメッシュ生成を実現する。
参考スコア（独自算出の注目度）: 51.20830808525894
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent years have seen significant advancements in 3D generation. While methods like score distillation achieve impressive results, they often require extensive per-scene optimization, which limits their time efficiency. On the other hand, reconstruction-based approaches are more efficient but tend to compromise quality due to their limited ability to handle uncertainty. We introduce GECO, a novel method for high-quality 3D generative modeling that operates within a second. Our approach addresses the prevalent issues of uncertainty and inefficiency in existing methods through a two-stage approach. In the first stage, we train a single-step multi-view generative model with score distillation. Then, a second-stage distillation is applied to address the challenge of view inconsistency in the multi-view generation. This two-stage process ensures a balanced approach to 3D generation, optimizing both quality and efficiency. Our comprehensive experiments demonstrate that GECO achieves high-quality image-to-3D mesh generation with an unprecedented level of efficiency. We will make the code and model publicly available.
Abstract（参考訳）: 近年では3D世代が著しく進歩している。スコア蒸留のような手法は印象的な結果をもたらすが、多くの場合、時間効率を制限したシーンごとの最適化が必要である。一方、再構築に基づくアプローチはより効率的であるが、不確実性に対処する能力に制限があるため、品質を損なう傾向がある。本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。提案手法は,既存の手法における不確実性と非効率性の問題を2段階のアプローチで解決する。第1段階では,スコア蒸留を用いた一段階多視点生成モデルを訓練する。次に,多視点世代における視点の不整合に対処するため,第2段蒸留を適用した。この2段階のプロセスは、3D生成に対するバランスの取れたアプローチを確保し、品質と効率の両方を最適化する。包括的実験により,GECOは前例のない効率で高品質な画像-3Dメッシュ生成を実現することが示された。コードとモデルを公開します。

関連論文リスト

Acc3D: Accelerating Single Image to 3D Diffusion Models via Edge Consistency Guided Score Distillation [49.202383675543466]
本稿では,単一画像から3次元モデルを生成する拡散過程の高速化に取り組むために,Acc3Dを提案する。数段階の推論によって高品質な再構成を導出するため,ランダムノイズ状態におけるスコア関数の学習を規則化する上で重要な課題を強調した。
論文参考訳（メタデータ） (2025-03-20T09:18:10Z)
GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior [25.72805054203982]
テキストと画像のプロンプトから現実的な3D人物を識別する2段階のフレームワークを提案する。私たちの中核となる洞察は、人中心の知識を活用して生成プロセスを促進することです。実験により、ガウシアンIPは視覚的品質とトレーニング効率の両方で既存の手法より優れていることが示された。
論文参考訳（メタデータ） (2025-03-14T07:16:43Z)
ControLRM: Fast and Controllable 3D Generation via Large Reconstruction Model [36.34976357766257]
高速かつ制御可能な3D生成のためのエンドツーエンドフィードフォワードモデルであるControLRMを紹介する。 ControLRMは、2Dコンディションジェネレータ、コンディションエンコーディングトランス、トリプレーンデコーダトランスを備える。条件訓練部では, トリプレーンデコーダをロックし, LRM内の数百万の3Dデータで事前訓練されたディープ・ロバストな符号化層を再利用する。画像訓練部では, 3次元デコーダをアンロックして2次元表現と3次元表現の間に暗黙のアライメントを確立する。
論文参考訳（メタデータ） (2024-10-12T16:47:20Z)
MVGaussian: High-Fidelity text-to-3D Content Generation with Multi-View Guidance and Surface Densification [13.872254142378772]
本稿では,テキスト・ツー・3Dコンテンツ生成のための統合フレームワークを提案する。提案手法は3次元モデルの構造を反復的に形成するために多視点誘導を利用する。また,表面近傍にガウスを配向させる新しい密度化アルゴリズムを導入する。
論文参考訳（メタデータ） (2024-09-10T16:16:34Z)
VividDreamer: Towards High-Fidelity and Efficient Text-to-3D Generation [69.68568248073747]
拡散に基づく3次元生成タスクにおいて, ポーズ依存型連続蒸留サンプリング (PCDS) を提案する。 PCDSは拡散軌道内でポーズ依存整合関数を構築し、最小サンプリングステップで真の勾配を近似することができる。そこで我々は,まず1ステップのPCDSを用いて3Dオブジェクトの基本構造を作成し,さらに徐々にPCDSのステップを拡大して細かな細部を生成する,粗大な最適化手法を提案する。
論文参考訳（メタデータ） (2024-06-21T08:21:52Z)
MVHuman: Tailoring 2D Diffusion with Multi-view Sampling For Realistic 3D Human Generation [45.88714821939144]
テキスト誘導から人間の放射界を生成するためのMVHumanという代替スキームを提案する。我々のコアは、一貫したマルチビュー画像を生成するための事前学習されたネットワークのデノイングプロセスを調整するためのマルチビューサンプリング戦略である。
論文参考訳（メタデータ） (2023-12-15T11:56:26Z)
Wonder3D: Single Image to 3D using Cross-Domain Diffusion [105.16622018766236]
Wonder3Dは、単一視点画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である。画像から3Dまでのタスクの品質,一貫性,効率性を総括的に改善するため,領域間拡散モデルを提案する。
論文参考訳（メタデータ） (2023-10-23T15:02:23Z)
HiFi-123: Towards High-fidelity One Image to 3D Content Generation [64.81863143986384]
HiFi-123は高忠実で多視点で一貫した3D生成のために設計された手法である。本稿では,拡散型ゼロショットノベルビュー合成法の忠実度を大幅に向上する参照ガイド型新規ビュー拡張(RGNV)技術を提案する。また,新たにRGSD(Reference-Guided State Distillation)を施行した。
論文参考訳（メタデータ） (2023-10-10T16:14:20Z)
DreamGaussian: Generative Gaussian Splatting for Efficient 3D Content Creation [55.661467968178066]
本稿では,DreamGaussianを提案する。DreamGaussianは,効率と品質を両立させる新しい3Dコンテンツ生成フレームワークである。我々の重要な洞察は、UV空間におけるメッシュ抽出とテクスチャ改善を伴う3次元ガウススプラッティングモデルを設計することである。ニューラル・ラジアンス・フィールドにおける占有プルーニングとは対照的に、3次元ガウスの進行的な密度化は3次元生成タスクにおいて著しく速く収束することを示した。
論文参考訳（メタデータ） (2023-09-28T17:55:05Z)
Efficient Geometry-aware 3D Generative Adversarial Networks [50.68436093869381]
既存の3D GANは計算集約的であるか、3D一貫性のない近似を行う。本研究では、3D GANの計算効率と画質をこれらの近似に頼らずに改善する。本稿では,高解像度のマルチビュー一貫性画像だけでなく,高品質な3次元形状をリアルタイムに合成する,表現型ハイブリッド・明示型ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2021-12-15T08:01:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。