論文の概要: Target-Balanced Score Distillation
- arxiv url: http://arxiv.org/abs/2511.11710v1
- Date: Wed, 12 Nov 2025 15:53:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.079389
- Title: Target-Balanced Score Distillation
- Title(参考訳): ターゲットベーススコア蒸留
- Authors: Zhou Xu, Qi Wang, Yuxiao Yang, Luyuan Zhang, Zhang Liang, Yang Li,
- Abstract要約: SDS(Score Distillation Sampling)は、事前訓練された2次元テキスト-画像拡散モデルから先行データを蒸留することで、3Dアセット生成を可能にする。
この問題を緩和するために、最近の変種にはネガティブなプロンプトが組み込まれている。
これらの手法は、限られたテクスチャ最適化や、形状歪みを伴う重要なテクスチャゲインといった重要なトレードオフに直面している。
- 参考スコア(独自算出の注目度): 6.815973656627764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Score Distillation Sampling (SDS) enables 3D asset generation by distilling priors from pretrained 2D text-to-image diffusion models, but vanilla SDS suffers from over-saturation and over-smoothing. To mitigate this issue, recent variants have incorporated negative prompts. However, these methods face a critical trade-off: limited texture optimization, or significant texture gains with shape distortion. In this work, we first conduct a systematic analysis and reveal that this trade-off is fundamentally governed by the utilization of the negative prompts, where Target Negative Prompts (TNP) that embed target information in the negative prompts dramatically enhancing texture realism and fidelity but inducing shape distortions. Informed by this key insight, we introduce the Target-Balanced Score Distillation (TBSD). It formulates generation as a multi-objective optimization problem and introduces an adaptive strategy that effectively resolves the aforementioned trade-off. Extensive experiments demonstrate that TBSD significantly outperforms existing state-of-the-art methods, yielding 3D assets with high-fidelity textures and geometrically accurate shape.
- Abstract(参考訳): SDS(Score Distillation Sampling)は、事前訓練された2次元テキスト・画像拡散モデルから先行データを蒸留することで3次元アセット生成を可能にするが、バニラSDSは過飽和と過平滑化に悩まされる。
この問題を緩和するために、最近の変種にはネガティブなプロンプトが組み込まれている。
しかし、これらの手法はテクスチャ最適化の制限や、形状歪みを伴う重要なテクスチャゲインといった重要なトレードオフに直面している。
本稿では,まず,このトレードオフが負のプロンプトの活用によって根本的に制御されていることを明らかにする。そこでは,ターゲット負のプロンプト(TNP)を負のプロンプトに埋め込んだターゲット負のプロンプト(TNP)が,テクスチャリアリズムとフィディリティを劇的に向上させるが,形状歪みを誘発する。
この重要な知見から,我々はTarget-Balanced Score Distillation (TBSD)を紹介した。
多目的最適化問題として生成を定式化し、上記のトレードオフを効果的に解決する適応戦略を導入する。
大規模な実験により、TBSDは既存の最先端手法を著しく上回り、高忠実なテクスチャと幾何学的に正確な形状を持つ3Dアセットが得られることが示された。
関連論文リスト
- Advancing Text-to-3D Generation with Linearized Lookahead Variational Score Distillation [10.863222482923605]
スコア蒸留モデルの線形化変種を提案し,L2$-VSDによるライナライズドルックアヘッド変量スコア蒸留(L2$-VSD)を提案する。
L2$-VSDは、既存のディープラーニングライブラリの前方モードのオートディフ機能で効率的に実現できる。
また,本手法を他のVSDベースのテキスト・ツー・3Dフレームワークにシームレスに組み込むことができることを示す。
論文 参考訳(メタデータ) (2025-07-13T18:57:45Z) - DreamMapping: High-Fidelity Text-to-3D Generation via Variational Distribution Mapping [20.7584503748821]
SDS (Score Distillation Sampling) はテキストから3D生成の一般的な技術として登場し、テキストから2Dのガイダンスからビュー依存情報を蒸留することで3Dコンテンツ作成を可能にする。
我々は、SDSの徹底的な解析を行い、その定式化を洗練し、中心となる設計はレンダリングされた画像の分布をモデル化することである。
本稿では,分散に基づく生成の劣化事例として,画像の描画を考慮し,分散モデリングプロセスの迅速化を図る,変分分布マッピング (VDM) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-08T14:04:48Z) - A Quantitative Evaluation of Score Distillation Sampling Based
Text-to-3D [54.78611187426158]
本研究では,SDS手法の故障事例を定量的に分析し,人間の評価によって相互に検証する,より客観的な定量的評価指標を提案する。
計算効率の良い新しいベースラインモデルを設計することで,この解析の有効性を実証する。
論文 参考訳(メタデータ) (2024-02-29T00:54:09Z) - Taming Mode Collapse in Score Distillation for Text-to-3D Generation [70.32101198891465]
Janus"アーティファクトはテキストから3D生成における問題であり、生成されたオブジェクトは複数のフロントフェイスで各ビューを偽装する。
エントロピースコア蒸留(Entropic Score Distillation, ESD)と呼ばれる新しい3Dスコア蒸留法を提案する。
恥ずかしいほど単純ではないが,我々はESDがJanusアーティファクトのスコア蒸留に有効であることを示す実験を行った。
論文 参考訳(メタデータ) (2023-12-31T22:47:06Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - PaintHuman: Towards High-fidelity Text-to-3D Human Texturing via
Denoised Score Distillation [89.09455618184239]
テキスト・ツー・3D世代における最近の進歩は画期的なものである。
そこで我々はPaintHumanというモデルを提案し,その課題を2つの側面から解決する。
奥行きマップを手引きとして,現実的なセマンティックなテクスチャの整合性を保証する。
論文 参考訳(メタデータ) (2023-10-14T00:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。