論文の概要: CADE 2.5 - ZeResFDG: Frequency-Decoupled, Rescaled and Zero-Projected Guidance for SD/SDXL Latent Diffusion Models
- arxiv url: http://arxiv.org/abs/2510.12954v1
- Date: Tue, 14 Oct 2025 19:57:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.403568
- Title: CADE 2.5 - ZeResFDG: Frequency-Decoupled, Rescaled and Zero-Projected Guidance for SD/SDXL Latent Diffusion Models
- Title(参考訳): CADE 2.5 - ZeResFDG:SD/SDXL遅延拡散モデルのための周波数分離・再スケール・ゼロ計画誘導
- Authors: Denis Rychkovskiy, GPT-5,
- Abstract要約: SD/SDXL遅延拡散モデルのためのサンプルレベルガイダンススタックであるFDG 2.5(Comfy Adaptive Detail Enhancer)を紹介する。
ZeResFDGは、(i)誘導信号の低周波成分と高周波成分を再重み付けする周波数分離誘導、(ii)誘導予測のサンプルごとの大きさと正の分岐に一致するエネルギー再スケーリング、(iii)非条件方向と平行な成分を除去するゼロ投影を統一する。
SD/SDXLサンプリング装置全体では、ZeResCADEはシャープネスを改善し、順応し、調整することなく適度なスケールで制御する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce CADE 2.5 (Comfy Adaptive Detail Enhancer), a sampler-level guidance stack for SD/SDXL latent diffusion models. The central module, ZeResFDG, unifies (i) frequency-decoupled guidance that reweights low- and high-frequency components of the guidance signal, (ii) energy rescaling that matches the per-sample magnitude of the guided prediction to the positive branch, and (iii) zero-projection that removes the component parallel to the unconditional direction. A lightweight spectral EMA with hysteresis switches between a conservative and a detail-seeking mode as structure crystallizes during sampling. Across SD/SDXL samplers, ZeResFDG improves sharpness, prompt adherence, and artifact control at moderate guidance scales without any retraining. In addition, we employ a training-free inference-time stabilizer, QSilk Micrograin Stabilizer (quantile clamp + depth/edge-gated micro-detail injection), which improves robustness and yields natural high-frequency micro-texture at high resolutions with negligible overhead. For completeness we note that the same rule is compatible with alternative parameterizations (e.g., velocity), which we briefly discuss in the Appendix; however, this paper focuses on SD/SDXL latent diffusion models.
- Abstract(参考訳): SD/SDXL遅延拡散モデルのためのサンプルレベルガイダンススタックであるCADE 2.5(Comfy Adaptive Detail Enhancer)を紹介する。
中心モジュールであるZeResFDGが統一される
一 誘導信号の低周波成分及び高周波成分を再重み付けする周波数分離誘導
(二)ガイド付き予測のサンプルごとの等級と正の分岐に一致するエネルギー再スケーリング、及び
三 非条件方向と平行な成分を除去するゼロ射影
ヒステリシスを持つ軽量スペクトルEMAは、サンプリング中に構造が結晶化するにつれて、保守的モードと詳細検索モードの間を切り替える。
SD/SDXLサンプリング装置全体では、ZeResFDGはシャープネス、アテンデンス、アーティファクトコントロールを適度なガイダンススケールで改善する。
さらに,QSilk Micrograin Stabilizer (quantile clamp + depth/edge-gated micro-detail Injection) をトレーニングフリーな推論時安定化器として採用した。
完全性については、同じ規則はAppendixで簡単に論じた代替パラメータ化(例えば速度)と互換性があるが、この記事ではSD/SDXL遅延拡散モデルに焦点を当てる。
関連論文リスト
- TAG:Tangential Amplifying Guidance for Hallucination-Resistant Diffusion Sampling [53.61290359948953]
タンジェンシャル増幅誘導(TAG)は、下層の拡散モデルを変更することなく、軌道信号のみで動作する。
この誘導過程を1次テイラー展開を利用して定式化する。
TAGは、最小限の計算加算で拡散サンプリング忠実度を改善する、プラグアンドプレイのアーキテクチャに依存しないモジュールである。
論文 参考訳(メタデータ) (2025-10-06T06:53:29Z) - Physics-Guided Diffusion Transformer with Spherical Harmonic Posterior Sampling for High-Fidelity Angular Super-Resolution in Diffusion MRI [10.521817442478543]
物理誘導拡散変換器 (PGDiT) を導入し, トレーニング段階と推論段階の両方において, 物理的先行を探索する。
トレーニング中、bベクトル変調とランダム角マスキングを備えたQ-space Geometry-Aware Module (QGAM)は、方向対応表現学習を容易にする。
推測では、2段階の球高調波誘導後サンプリング(SHPS)が取得したデータとの整合を強制し、続いて熱拡散に基づく正則化によって物理的に妥当な再構成が保証される。
論文 参考訳(メタデータ) (2025-09-07T04:31:58Z) - KV-Latent: Dimensional-level KV Cache Reduction with Frequency-aware Rotary Positional Embedding [72.12756830560217]
Transformer Decodersをベースとした大規模言語モデル(LLM)が、会話生成AIの選択肢として好まれている。
デコーダアーキテクチャの全体的な優位性にもかかわらず、推論中にキーバリューキャッシュが徐々に増加し、主要な効率ボトルネックとなっている。
キーバリューベクトル次元を潜在空間にダウンサンプリングすることで、KVキャッシュのフットプリントを大幅に削減し、推論速度を向上させることができる。
論文 参考訳(メタデータ) (2025-07-15T12:52:12Z) - Rethinking Oversaturation in Classifier-Free Guidance via Low Frequency [7.3604864243987365]
低周波信号に基づく新しい視点を導入する。
これらの信号の冗長な情報の蓄積は、過飽和や非現実的なアーティファクトの背後にある重要な要因である。
実験により,LF-CFGは様々な拡散モデルにおける過飽和や非現実的アーティファクトを効果的に緩和することを示した。
論文 参考訳(メタデータ) (2025-06-26T16:34:00Z) - Making the unmodulated pyramid wavefront sensor smart II. First on-sky demonstration of extreme adaptive optics with deep learning [0.08121379264351831]
ピラミッド波面センサ(PWFS)は、現在および将来の極端適応光学(XAO)システムにおいて好まれる選択である。
ほぼ全ての機器は、有限線型性範囲を緩和するために、PWFSを変調形式で使用する。
我々は、変調されていないPWFSを用いたXAOの最初のオンスキーデモンストレーションを示す。
論文 参考訳(メタデータ) (2025-03-20T20:17:30Z) - WaveDiffUR: A diffusion SDE-based solver for ultra magnification super-resolution in remote sensing images [2.7830219396433704]
本稿では,ウェーブレット領域拡散URソルバであるWaveDiffURを導入し,UR過程を条件付きウェーブレット成分に対処するシーケンシャルサブプロセスに分解する。
WaveDiffURは、訓練済みSRモデルをプラグ・アンド・プレイモジュールとして組み込むことで、低周波の詳細(グローバル整合性を保証する)と高周波成分(局所忠実性を高める)を反復的に再構築する。
固定境界条件の限界を極端に拡大するために,クロススケールピラミッド (CSP) フレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-25T22:26:39Z) - DC-Solver: Improving Predictor-Corrector Diffusion Sampler via Dynamic Compensation [68.55191764622525]
拡散モデル(DPM)は、視覚合成において顕著な性能を示すが、サンプリング中に複数の評価を必要とするため、計算コストが高い。
最近の予測器合成・拡散サンプリング装置は,要求される評価回数を大幅に削減したが,本質的には誤調整の問題に悩まされている。
我々はDC-CPRrと呼ばれる新しい高速DPMサンプリング装置を導入する。
論文 参考訳(メタデータ) (2024-09-05T17:59:46Z) - SMRD: SURE-based Robust MRI Reconstruction with Diffusion Models [76.43625653814911]
拡散モデルは、高い試料品質のため、MRIの再生を加速するために人気を博している。
推論時に柔軟にフォワードモデルを組み込んだまま、効果的にリッチなデータプリエントとして機能することができる。
拡散モデル(SMRD)を用いたSUREに基づくMRI再構成を導入し,テスト時の堅牢性を向上する。
論文 参考訳(メタデータ) (2023-10-03T05:05:35Z) - Diffusion Probabilistic Model Made Slim [128.2227518929644]
軽量画像合成のためのスリム拡散確率モデル(DPM)のカスタマイズ設計を提案する。
一連の条件および非条件画像生成タスクにおける遅延拡散モデルと比較して,計算複雑性を8-18倍に削減する。
論文 参考訳(メタデータ) (2022-11-27T16:27:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。