Fugu-MT 論文翻訳(概要): Stable Score Distillation for High-Quality 3D Generation

論文の概要: Stable Score Distillation for High-Quality 3D Generation

arxiv url: http://arxiv.org/abs/2312.09305v1
Date: Thu, 14 Dec 2023 19:18:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-18 17:59:04.933311
Title: Stable Score Distillation for High-Quality 3D Generation
Title（参考訳）: 高品質3d生成のための安定スコア蒸留
Authors: Boshi Tang, Jianan Wang, Zhiyong Wu, Lei Zhang
Abstract要約: 本稿では,SDS(Score Distillation Sampling, SDS)の解釈を, モデジング, モード探索, 分散還元項の組み合わせとして提示する。本研究は,3つの機能的監督用語の内在的欠如から,過密度や彩度などの問題が生じることを示した。本稿では,高品位な3次元生成のための各用語をオーケストレーションする,SSD(Stable Score Distillation)というシンプルなアプローチを提案する。
参考スコア（独自算出の注目度）: 21.28421571320286
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Score Distillation Sampling (SDS) has exhibited remarkable performance in conditional 3D content generation. However, a comprehensive understanding of the SDS formulation is still lacking, hindering the development of 3D generation. In this work, we present an interpretation of SDS as a combination of three functional components: mode-disengaging, mode-seeking and variance-reducing terms, and analyze the properties of each. We show that problems such as over-smoothness and color-saturation result from the intrinsic deficiency of the supervision terms and reveal that the variance-reducing term introduced by SDS is sub-optimal. Additionally, we shed light on the adoption of large Classifier-Free Guidance (CFG) scale for 3D generation. Based on the analysis, we propose a simple yet effective approach named Stable Score Distillation (SSD) which strategically orchestrates each term for high-quality 3D generation. Extensive experiments validate the efficacy of our approach, demonstrating its ability to generate high-fidelity 3D content without succumbing to issues such as over-smoothness and over-saturation, even under low CFG conditions with the most challenging NeRF representation.
Abstract（参考訳）: SDS(Score Distillation Sampling)は条件付き3Dコンテンツ生成において顕著な性能を示した。しかし、SDSの定式化に関する包括的な理解はいまだに欠如しており、3D世代の発展を妨げる。本稿では,モード展開,モード探索,分散還元という3つの機能成分の組み合わせとしてSDSを解釈し,それぞれの特性を解析する。本研究は,SDSが導入した分散緩和項が準最適であることを示すとともに,過度なスムーズ性や彩度といった課題が,監督用語の内在的欠如に起因することを示した。さらに,大規模分類自由誘導(CFG)尺度を3次元世代に導入することにも光を当てた。本研究では,高品質な3d生成のための各用語を戦略的に編成する,安定スコア蒸留(ssd)という簡便で効果的な手法を提案する。比較的難易度の高い低CFG条件下においても, 過密度や過飽和度といった問題に対処することなく, 高忠実度3Dコンテンツを生成できることを実証し, 提案手法の有効性を検証した。

関連論文リスト

SegmentDreamer: Towards High-fidelity Text-to-3D Synthesis with Segmented Consistency Trajectory Distillation [37.329698607074114]
テキスト・ツー・3D生成の最近の進歩は、スコア蒸留サンプリング(SDS)とそのバリエーションの視覚的品質を改善している。自己整合性と相互整合性の不均衡のため、CDベースの手法は本質的に不適切な条件ガイダンスに悩まされる。我々は,高忠実度テキスト・ツー・3D生成のための一貫性モデルの可能性を完全に解き放つために設計された新しいフレームワークであるSegmentDreamerを提案する。
論文参考訳（メタデータ） (2025-07-07T17:59:05Z)
Dive3D: Diverse Distillation-based Text-to-3D Generation via Score Implicit Matching [14.267619174518106]
我々は,KLに基づく目的をScore Implicit Matching (SIM)損失に置き換える新しいテキストから3D生成フレームワークであるDive3Dを紹介する。様々な2D-to-3DプロンプトにまたがってDive3Dを検証した結果,定性評価において従来手法よりも常に優れていたことが判明した。 Dive3Dはまた、テキスト・アセットアライメント、3Dの可視性、テキスト・ジオメトリの一貫性、テクスチャの質、幾何学的ディテールなど、定量的な指標に関する強力な結果も達成している。
論文参考訳（メタデータ） (2025-06-16T15:21:30Z)
Rethinking Score Distilling Sampling for 3D Editing and Generation [50.52808917055502]
Unified Distillation Sampling (UDS)は、3Dアセットの生成と編集をシームレスに統合する手法である。 UDSは、より詳細な3Dアセットの生成において、ベースラインメソッドよりも優れているだけでなく、編集タスクも優れているため、3D生成と編集のギャップを埋める。
論文参考訳（メタデータ） (2025-05-03T18:40:39Z)
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models [69.0220314849478]
TripoSGは、入力画像に正確に対応した高忠実度3Dメッシュを生成することができる新しい合理化形状拡散パラダイムである。結果として得られた3D形状は、高解像度の能力によって細部が強化され、入力画像に異常な忠実さを示す。 3Dジェネレーションの分野における進歩と革新を促進するため、我々はモデルを一般公開する。
論文参考訳（メタデータ） (2025-02-10T16:07:54Z)
Consistent Flow Distillation for Text-to-3D Generation [14.150490171643034]
SDS (Score Distillation Sampling) は3次元画像生成モデルの蒸留に大きく貢献している。しかし、その最大形状探索行動は、視覚的品質と多様性の低下を招き、その3Dアプリケーションにおける有効性を制限している。本稿では,これらの制限に対処するコンシスタントフロー蒸留(CFD)を提案する。
論文参考訳（メタデータ） (2025-01-09T18:56:05Z)
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation [75.39457097832113]
本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,シングル/マルチビュー画像入力を可能にする。
論文参考訳（メタデータ） (2024-11-12T18:59:32Z)
Semantic Score Distillation Sampling for Compositional Text-to-3D Generation [28.88237230872795]
テキスト記述から高品質な3Dアセットを生成することは、コンピュータグラフィックスと視覚研究において重要な課題である。本稿では,合成テキストから3D生成までの表現性と精度の向上を目的とした新しいSDS手法を提案する。我々のアプローチは、異なるレンダリングビュー間の一貫性を維持する新しいセマンティック埋め込みを統合する。明示的な意味指導を活用することで,既存の事前学習拡散モデルの構成能力を解き放つ。
論文参考訳（メタデータ） (2024-10-11T17:26:00Z)
MVGaussian: High-Fidelity text-to-3D Content Generation with Multi-View Guidance and Surface Densification [13.872254142378772]
本稿では,テキスト・ツー・3Dコンテンツ生成のための統合フレームワークを提案する。提案手法は3次元モデルの構造を反復的に形成するために多視点誘導を利用する。また,表面近傍にガウスを配向させる新しい密度化アルゴリズムを導入する。
論文参考訳（メタデータ） (2024-09-10T16:16:34Z)
VividDreamer: Invariant Score Distillation For Hyper-Realistic Text-to-3D Generation [33.05759961083337]
Invariant Score Distillation (ISD) を提案する。 ISDは、スコア蒸留サンプリング(SDS)における過飽和および過平滑化問題に対処することを目的としている。
論文参考訳（メタデータ） (2024-07-13T09:33:16Z)
VividDreamer: Towards High-Fidelity and Efficient Text-to-3D Generation [69.68568248073747]
拡散に基づく3次元生成タスクにおいて, ポーズ依存型連続蒸留サンプリング (PCDS) を提案する。 PCDSは拡散軌道内でポーズ依存整合関数を構築し、最小サンプリングステップで真の勾配を近似することができる。そこで我々は,まず1ステップのPCDSを用いて3Dオブジェクトの基本構造を作成し,さらに徐々にPCDSのステップを拡大して細かな細部を生成する,粗大な最適化手法を提案する。
論文参考訳（メタデータ） (2024-06-21T08:21:52Z)
ExactDreamer: High-Fidelity Text-to-3D Content Creation via Exact Score Matching [10.362259643427526]
現在のアプローチは、しばしば3次元合成のために事前訓練された2次元拡散モデルを適用する。過剰な平滑化は、3Dモデルの高忠実度生成に重大な制限をもたらす。 LucidDreamer は SDS における Denoising Diffusion Probabilistic Model (DDPM) を Denoising Diffusion Implicit Model (DDIM) に置き換える
論文参考訳（メタデータ） (2024-05-24T20:19:45Z)
Flow Score Distillation for Diverse Text-to-3D Generation [23.38418695449777]
フロースコア蒸留(FSD)は品質を損なうことなく生成の多様性を大幅に向上させる。各種テキスト・画像拡散モデルを用いた検証実験により、FSDは品質を損なうことなく、生成の多様性を大幅に向上することを示した。
論文参考訳（メタデータ） (2024-05-16T06:05:16Z)
Consistent3D: Towards Consistent High-Fidelity Text-to-3D Generation with Deterministic Sampling Prior [87.55592645191122]
スコア蒸留サンプリング(SDS)とその変種は、テキスト・ツー・3D世代の発展を大幅に加速させたが、幾何崩壊やテクスチャの低下に弱い。テキストから3D生成に先立ってODE決定論的サンプリングを探索する新しい「一貫性3D」手法を提案する。実験により,高忠実で多様な3Dオブジェクトと大規模シーンの生成にConsistent3Dの有効性が示された。
論文参考訳（メタデータ） (2024-01-17T08:32:07Z)
StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文参考訳（メタデータ） (2023-12-02T02:27:58Z)
Guide3D: Create 3D Avatars from Text and Image Guidance [55.71306021041785]
Guide3Dは拡散モデルに基づく3Dアバター生成のためのテキスト・画像誘導生成モデルである。我々のフレームワークは、トポロジカルかつ構造的に正しい幾何と高分解能なテクスチャを生成する。
論文参考訳（メタデータ） (2023-08-18T17:55:47Z)
NeRF-GAN Distillation for Efficient 3D-Aware Generation with Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文参考訳（メタデータ） (2023-03-22T18:59:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。