論文の概要: Noise-Free Score Distillation
- arxiv url: http://arxiv.org/abs/2310.17590v1
- Date: Thu, 26 Oct 2023 17:12:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 18:49:11.055130
- Title: Noise-Free Score Distillation
- Title(参考訳): 無騒音スコア蒸留
- Authors: Oren Katzir, Or Patashnik, Daniel Cohen-Or, Dani Lischinski
- Abstract要約: ノイズフリースコア蒸留(NFSD)プロセスは、オリジナルのSDSフレームワークに最小限の変更を必要とする。
我々は,CFG尺度を用いて,事前学習したテキスト・画像拡散モデルのより効果的な蒸留を行う。
- 参考スコア(独自算出の注目度): 78.79226724549456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Score Distillation Sampling (SDS) has emerged as the de facto approach for
text-to-content generation in non-image domains. In this paper, we reexamine
the SDS process and introduce a straightforward interpretation that demystifies
the necessity for large Classifier-Free Guidance (CFG) scales, rooted in the
distillation of an undesired noise term. Building upon our interpretation, we
propose a novel Noise-Free Score Distillation (NFSD) process, which requires
minimal modifications to the original SDS framework. Through this streamlined
design, we achieve more effective distillation of pre-trained text-to-image
diffusion models while using a nominal CFG scale. This strategic choice allows
us to prevent the over-smoothing of results, ensuring that the generated data
is both realistic and complies with the desired prompt. To demonstrate the
efficacy of NFSD, we provide qualitative examples that compare NFSD and SDS, as
well as several other methods.
- Abstract(参考訳): SDS(Score Distillation Sampling)は、非画像領域におけるテキストからコンテンツへの生成の事実上のアプローチとして登場した。
本稿では,SDSプロセスを再検討し,不要な雑音項の蒸留に根ざした大規模分類自由誘導(CFG)尺度の必要性を確定する簡単な解釈を導入する。
この解釈に基づいて,従来のSDSフレームワークに最小限の変更を必要とする新しいノイズフリースコア蒸留(NFSD)プロセスを提案する。
この合理化設計により,CFGスケールを用いて,事前学習したテキスト・画像拡散モデルのより効率的な蒸留が可能となる。
この戦略的選択によって、結果の過剰なスムーズを防止し、生成されたデータが現実的であり、望ましいプロンプトに対応することを保証できます。
NFSDの有効性を示すために,NFSDとSDSを比較した定性的な例と,他のいくつかの方法を提案する。
関連論文リスト
- A Quantitative Evaluation of Score Distillation Sampling Based
Text-to-3D [54.78611187426158]
本研究では,SDS手法の故障事例を定量的に分析し,人間の評価によって相互に検証する,より客観的な定量的評価指標を提案する。
計算効率の良い新しいベースラインモデルを設計することで,この解析の有効性を実証する。
論文 参考訳(メタデータ) (2024-02-29T00:54:09Z) - Score Distillation Sampling with Learned Manifold Corrective [41.54375201921829]
本稿では、スコア蒸留サンプリング(SDS)損失関数の詳細な解析を行い、その定式化による固有の問題を特定し、驚くほど簡単だが効果的な修正を提案する。
損失を異なる要因に分解し,ノイズ勾配の原因となる成分を分離する。
元の定式化では、ノイズを考慮に入れ、不要な副作用を引き起こすため、画像拡散モデルの時間依存性の劣化を模倣した浅いネットワークを訓練し、効果的に分解する。
論文 参考訳(メタデータ) (2024-01-10T17:51:46Z) - Adversarial Score Distillation: When score distillation meets GAN [3.5825440071527375]
既存のスコア蒸留をWGAN(Wasserstein Generative Adversarial Network)パラダイムで解読する。
WGANのパラダイムでは、既存のスコア蒸留は固定された準最適判別器を使うか、不完全判別器の最適化を行うかのいずれかである。
本稿では、最適な判別器を維持し、完全な最適化目標を用いて更新するASD(Adversarial Score Distillation)を提案する。
論文 参考訳(メタデータ) (2023-12-01T17:20:47Z) - Contrastive Denoising Score for Text-guided Latent Diffusion Image
Editing [63.89492742059184]
本稿では,LDM(Latent Image-to-image Translation Model)に対するCDS(Contrastive Denoising Score)の変更について述べる。
具体的には,フレームワーク内のCUT損失を用いて構造的整合性を制御するための簡単なアプローチを提案する。
提案手法は,ゼロショット画像から画像への変換とニューラルフィールド(NeRF)の編集を可能にする。
論文 参考訳(メタデータ) (2023-11-30T15:06:10Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。
私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文 参考訳(メタデータ) (2020-08-06T02:07:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。