Fugu-MT 論文翻訳(概要): Noise-Free Score Distillation

論文の概要: Noise-Free Score Distillation

arxiv url: http://arxiv.org/abs/2310.17590v1
Date: Thu, 26 Oct 2023 17:12:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-27 18:49:11.055130
Title: Noise-Free Score Distillation
Title（参考訳）: 無騒音スコア蒸留
Authors: Oren Katzir, Or Patashnik, Daniel Cohen-Or, Dani Lischinski
Abstract要約: ノイズフリースコア蒸留(NFSD)プロセスは、オリジナルのSDSフレームワークに最小限の変更を必要とする。我々は,CFG尺度を用いて,事前学習したテキスト・画像拡散モデルのより効果的な蒸留を行う。
参考スコア（独自算出の注目度）: 78.79226724549456
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Score Distillation Sampling (SDS) has emerged as the de facto approach for text-to-content generation in non-image domains. In this paper, we reexamine the SDS process and introduce a straightforward interpretation that demystifies the necessity for large Classifier-Free Guidance (CFG) scales, rooted in the distillation of an undesired noise term. Building upon our interpretation, we propose a novel Noise-Free Score Distillation (NFSD) process, which requires minimal modifications to the original SDS framework. Through this streamlined design, we achieve more effective distillation of pre-trained text-to-image diffusion models while using a nominal CFG scale. This strategic choice allows us to prevent the over-smoothing of results, ensuring that the generated data is both realistic and complies with the desired prompt. To demonstrate the efficacy of NFSD, we provide qualitative examples that compare NFSD and SDS, as well as several other methods.
Abstract（参考訳）: SDS(Score Distillation Sampling)は、非画像領域におけるテキストからコンテンツへの生成の事実上のアプローチとして登場した。本稿では,SDSプロセスを再検討し,不要な雑音項の蒸留に根ざした大規模分類自由誘導(CFG)尺度の必要性を確定する簡単な解釈を導入する。この解釈に基づいて,従来のSDSフレームワークに最小限の変更を必要とする新しいノイズフリースコア蒸留(NFSD)プロセスを提案する。この合理化設計により,CFGスケールを用いて,事前学習したテキスト・画像拡散モデルのより効率的な蒸留が可能となる。この戦略的選択によって、結果の過剰なスムーズを防止し、生成されたデータが現実的であり、望ましいプロンプトに対応することを保証できます。 NFSDの有効性を示すために,NFSDとSDSを比較した定性的な例と,他のいくつかの方法を提案する。

関連論文リスト

Diffusion-Based Limited-Angle CT Reconstruction under Noisy Conditions [10.287171164361608]
角投影の欠如は、再構成された画像の不完全なシノグラムやアーティファクトに繋がる。本稿では, 平均回帰微分方程式(MR-SDE)を用いて, 角ビューの欠落を解消する拡散型フレームワークを提案する。現実的な雑音下でのロバスト性を改善するために,推論時間不確実性を明示的にモデル化する新しいノイズ認識機構を提案する。
論文参考訳（メタデータ） (2025-07-08T03:58:52Z)
Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文参考訳（メタデータ） (2025-06-11T06:01:39Z)
Few-Step Diffusion via Score identity Distillation [67.07985339442703]
拡散蒸留は, テキスト・ツー・イメージ(T2I)拡散モデルを促進するための有望な戦略として浮上している。既存の方法は、高分解能T2I拡散モデルを蒸留する際に、実像や教師合成画像に頼っている。教師のCFGを無効にし、偽スコアネットワークでテキストコンディショニングを除去するZero-CFGと、偽スコアネットワークで否定的なCFGを適用するAnti-CFGの2つの新しいガイダンス戦略を提案する。
論文参考訳（メタデータ） (2025-05-19T03:45:16Z)
Identity-preserving Distillation Sampling by Fixed-Point Iterator [39.405536448895084]
アイデンティティ保存蒸留サンプリング(IDS)は、結果に望ましくない変化をもたらす勾配を補正する。 IDSはスコア自体を変更するために提案されており、ポーズや構造を含むアイデンティティの保存を促進する。提案手法は、FPRによる自己補正により、画像間編集および編集可能なニューラル放射場(NeRF)において、与えられたプロンプトに対応する明確で曖昧な表現を提供する。
論文参考訳（メタデータ） (2025-02-27T09:59:38Z)
VividDreamer: Invariant Score Distillation For Hyper-Realistic Text-to-3D Generation [33.05759961083337]
Invariant Score Distillation (ISD) を提案する。 ISDは、スコア蒸留サンプリング(SDS)における過飽和および過平滑化問題に対処することを目的としている。
論文参考訳（メタデータ） (2024-07-13T09:33:16Z)
Guided Score identity Distillation for Data-Free One-Step Text-to-Image Generation [62.30570286073223]
拡散に基づくテキスト・画像生成モデルは、テキスト記述と整合した画像を生成する能力を実証している。本研究では, 実データにアクセスすることなく, 事前学習した拡散モデルの効率的な蒸留を可能にする, データフリーガイド蒸留法を提案する。データフリー蒸留法は, 1ステップ生成装置で生成した合成画像のみをトレーニングすることにより, FIDとCLIPのスコアを急速に向上させ, 競争力のあるCLIPスコアを維持しつつ, 最先端のFID性能を実現する。
論文参考訳（メタデータ） (2024-06-03T17:44:11Z)
Flow Score Distillation for Diverse Text-to-3D Generation [23.38418695449777]
フロースコア蒸留(FSD)は品質を損なうことなく生成の多様性を大幅に向上させる。各種テキスト・画像拡散モデルを用いた検証実験により、FSDは品質を損なうことなく、生成の多様性を大幅に向上することを示した。
論文参考訳（メタデータ） (2024-05-16T06:05:16Z)
Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。 E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文参考訳（メタデータ） (2024-05-09T17:59:40Z)
A Quantitative Evaluation of Score Distillation Sampling Based Text-to-3D [54.78611187426158]
本研究では,SDS手法の故障事例を定量的に分析し,人間の評価によって相互に検証する,より客観的な定量的評価指標を提案する。計算効率の良い新しいベースラインモデルを設計することで,この解析の有効性を実証する。
論文参考訳（メタデータ） (2024-02-29T00:54:09Z)
Score Distillation Sampling with Learned Manifold Corrective [36.963929141091455]
損失を異なる要因に分解し,ノイズ勾配の原因となる成分を分離する。オリジナルの定式化では、ノイズを考慮に入れた高いテキストガイダンスが使用され、過飽和や繰り返し詳細といった不要な副作用が生じる。我々は,画像拡散モデルの時間依存性周波数バイアスを模倣した浅層ネットワークを訓練し,これを効果的に導出する。
論文参考訳（メタデータ） (2024-01-10T17:51:46Z)
Adversarial Score Distillation: When score distillation meets GAN [3.2794321281011394]
既存のスコア蒸留をWGAN(Wasserstein Generative Adversarial Network)パラダイムで解読する。 WGANのパラダイムでは、既存のスコア蒸留は固定された準最適判別器を使うか、不完全判別器の最適化を行うかのいずれかである。本稿では、最適な判別器を維持し、完全な最適化目標を用いて更新するASD(Adversarial Score Distillation)を提案する。
論文参考訳（メタデータ） (2023-12-01T17:20:47Z)
Contrastive Denoising Score for Text-guided Latent Diffusion Image Editing [58.48890547818074]
潜在拡散モデル(LDM)に対するコントラストデノナイジングスコア(CUT)の強力な修正を提案する。提案手法により,ゼロショット画像から画像への変換とニューラルフィールド(NeRF)の編集が可能となり,入力と出力の間の構造的対応が達成される。
論文参考訳（メタデータ） (2023-11-30T15:06:10Z)
SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文参考訳（メタデータ） (2022-06-09T14:00:26Z)
Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文参考訳（メタデータ） (2020-08-06T02:07:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。