論文の概要: A Quantitative Evaluation of Score Distillation Sampling Based
Text-to-3D
- arxiv url: http://arxiv.org/abs/2402.18780v1
- Date: Thu, 29 Feb 2024 00:54:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 16:34:17.791931
- Title: A Quantitative Evaluation of Score Distillation Sampling Based
Text-to-3D
- Title(参考訳): テキスト・トゥ・3Dによるスコア蒸留サンプリングの定量的評価
- Authors: Xiaohan Fei, Chethan Parameshwara, Jiawei Mo, Xiaolong Li, Ashwin
Swaminathan, CJ Taylor, Paolo Favaro, Stefano Soatto
- Abstract要約: 本研究では,SDS手法の故障事例を定量的に分析し,人間の評価によって相互に検証する,より客観的な定量的評価指標を提案する。
計算効率の良い新しいベースラインモデルを設計することで,この解析の有効性を実証する。
- 参考スコア(独自算出の注目度): 54.78611187426158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of generative models that create 3D content from a text
prompt has made considerable strides thanks to the use of the score
distillation sampling (SDS) method on pre-trained diffusion models for image
generation. However, the SDS method is also the source of several artifacts,
such as the Janus problem, the misalignment between the text prompt and the
generated 3D model, and 3D model inaccuracies. While existing methods heavily
rely on the qualitative assessment of these artifacts through visual inspection
of a limited set of samples, in this work we propose more objective
quantitative evaluation metrics, which we cross-validate via human ratings, and
show analysis of the failure cases of the SDS technique. We demonstrate the
effectiveness of this analysis by designing a novel computationally efficient
baseline model that achieves state-of-the-art performance on the proposed
metrics while addressing all the above-mentioned artifacts.
- Abstract(参考訳): テキストプロンプトから3Dコンテンツを生成する生成モデルの開発は、画像生成のための事前学習拡散モデルにスコア蒸留サンプリング(SDS)法を用いることにより、かなりの進歩を遂げている。
しかし、SDS法は、Janus問題、テキストプロンプトと生成された3Dモデルとのミスアライメント、そして3Dモデルの不正確さなど、いくつかのアーティファクトの源でもある。
既存の手法は,限られたサンプルを視覚的に検査することで,これらの成果物の質的評価に大きく依存するが,本研究では,人間の評価によって相互に検証する,より客観的な定量的評価指標を提案し,SDS手法の故障事例の分析を行った。
本研究は,提案した指標の最先端性能を達成し,上記のすべての成果物に対処する,計算効率の良い新しいベースラインモデルを設計することで,この分析の有効性を実証する。
関連論文リスト
- MVGaussian: High-Fidelity text-to-3D Content Generation with Multi-View Guidance and Surface Densification [13.872254142378772]
本稿では,テキスト・ツー・3Dコンテンツ生成のための統合フレームワークを提案する。
提案手法は3次元モデルの構造を反復的に形成するために多視点誘導を利用する。
また,表面近傍にガウスを配向させる新しい密度化アルゴリズムを導入する。
論文 参考訳(メタデータ) (2024-09-10T16:16:34Z) - DreamMapping: High-Fidelity Text-to-3D Generation via Variational Distribution Mapping [20.7584503748821]
SDS (Score Distillation Sampling) はテキストから3D生成の一般的な技術として登場し、テキストから2Dのガイダンスからビュー依存情報を蒸留することで3Dコンテンツ作成を可能にする。
我々は、SDSの徹底的な解析を行い、その定式化を洗練し、中心となる設計はレンダリングされた画像の分布をモデル化することである。
本稿では,分散に基づく生成の劣化事例として,画像の描画を考慮し,分散モデリングプロセスの迅速化を図る,変分分布マッピング (VDM) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-08T14:04:48Z) - Flow Score Distillation for Diverse Text-to-3D Generation [23.38418695449777]
フロースコア蒸留(FSD)は品質を損なうことなく生成の多様性を大幅に向上させる。
各種テキスト・画像拡散モデルを用いた検証実験により、FSDは品質を損なうことなく、生成の多様性を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-05-16T06:05:16Z) - Learn to Optimize Denoising Scores for 3D Generation: A Unified and
Improved Diffusion Prior on NeRF and 3D Gaussian Splatting [60.393072253444934]
本稿では,3次元生成タスクの拡散先行性向上を目的とした統合フレームワークを提案する。
拡散先行と拡散モデルの訓練手順の相違を同定し、3次元生成の質を著しく損なう。
論文 参考訳(メタデータ) (2023-12-08T03:55:34Z) - EucliDreamer: Fast and High-Quality Texturing for 3D Models with Stable Diffusion Depth [5.158983929861116]
テキストプロンプトと3Dメッシュが与えられた3次元モデルのテクスチャを生成する新しい手法を提案する。
追加の深度情報を考慮し、スコア蒸留サンプリング(SDS)プロセスを実行する。
論文 参考訳(メタデータ) (2023-11-27T06:55:53Z) - Text-to-3D with Classifier Score Distillation [80.14832887529259]
クラシファイアフリーガイダンスは最も必須ではなく、補助的なトリックだと考えられている。
我々はこの手法をスコア蒸留 (CSD) と名付け, 生成のための暗黙の分類モデルを用いて解釈できる。
我々は,形状生成,テクスチャ合成,形状編集など,テキストから3Dまでの各種タスクにおけるCSDの有効性を検証した。
論文 参考訳(メタデータ) (2023-10-30T10:25:40Z) - Noise-Free Score Distillation [78.79226724549456]
ノイズフリースコア蒸留(NFSD)プロセスは、オリジナルのSDSフレームワークに最小限の変更を必要とする。
我々は,CFG尺度を用いて,事前学習したテキスト・画像拡散モデルのより効果的な蒸留を行う。
論文 参考訳(メタデータ) (2023-10-26T17:12:26Z) - PaintHuman: Towards High-fidelity Text-to-3D Human Texturing via
Denoised Score Distillation [89.09455618184239]
テキスト・ツー・3D世代における最近の進歩は画期的なものである。
そこで我々はPaintHumanというモデルを提案し,その課題を2つの側面から解決する。
奥行きマップを手引きとして,現実的なセマンティックなテクスチャの整合性を保証する。
論文 参考訳(メタデータ) (2023-10-14T00:37:16Z) - IT3D: Improved Text-to-3D Generation with Explicit View Synthesis [71.68595192524843]
本研究では、これらの問題に対処するために、明示的に合成されたマルチビュー画像を活用する新しい戦略を提案する。
我々のアプローチは、高画質画像を生成するために、LCDによって強化されたイメージ・ツー・イメージ・パイプラインを活用することである。
組込み判別器では、合成したマルチビュー画像は実データと見なされ、最適化された3Dモデルのレンダリングは偽データとして機能する。
論文 参考訳(メタデータ) (2023-08-22T14:39:17Z) - HD-Fusion: Detailed Text-to-3D Generation Leveraging Multiple Noise
Estimation [43.83459204345063]
本稿では,複数の雑音推定プロセスと事前学習した2次元拡散を併用した新しい手法を提案する。
その結果,提案手法はベースラインと比較して高品質な細部を生成できることが示唆された。
論文 参考訳(メタデータ) (2023-07-30T09:46:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。