論文の概要: Ctrl-Z Sampling: Diffusion Sampling with Controlled Random Zigzag Explorations
- arxiv url: http://arxiv.org/abs/2506.20294v1
- Date: Wed, 25 Jun 2025 10:01:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.690244
- Title: Ctrl-Z Sampling: Diffusion Sampling with Controlled Random Zigzag Explorations
- Title(参考訳): Ctrl-Zサンプリング:ランダムジグザグ探索による拡散サンプリング
- Authors: Shunqi Mao, Wei Guo, Chaoyi Zhang, Weidong Cai,
- Abstract要約: 拡散モデルは、視覚的に一貫性があるが世界的に矛盾する局所最適に収束する。
制御ランダムジグザグサンプリング(Ctrl-Zサンプリング)を導入し、そのような局所的な最大値を検出して回避する。
実験の結果,Ctrl-Zサンプリングは,約7.6倍の関数評価で生成品質を著しく向上することがわかった。
- 参考スコア(独自算出の注目度): 15.676152354452013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have shown strong performance in conditional generation by progressively denoising Gaussian noise toward a target data distribution. This denoising process can be interpreted as a form of hill climbing in a learned latent space, where the model iteratively refines the sample toward regions of higher probability. However, diffusion models often converge to local optima that are locally visually coherent yet globally inconsistent or conditionally misaligned, due to latent space complexity and suboptimal initialization. Prior efforts attempted to address this by strengthening guidance signals or manipulating the initial noise distribution. We introduce Controlled Random Zigzag Sampling (Ctrl-Z Sampling), a novel sampling strategy designed to detect and escape such local maxima during conditional generation. The method first identifies potential local maxima using a reward model. Upon detection, it injects noise and reverts to a previous, noisier state to escape the current optimization plateau. The reward model then evaluates candidate trajectories, accepting only those that offer improvement, while progressively deeper retreat enables stronger escapes when nearby alternatives fail. This controlled random zigzag process allows dynamic alternation between forward refinement and backward exploration, enhancing both alignment and visual quality in the generated outputs. The proposed Ctrl-Z Sampling is model-agnostic and compatible with existing diffusion frameworks. Experimental results show that Ctrl-Z Sampling substantially improves generation quality with only around 7.6X increase in function evaluations.
- Abstract(参考訳): 拡散モデルは、ガウス雑音を目標データ分布に向けて段階的にデノベーションすることで条件生成において強い性能を示す。
このデノナイジング過程は、学習された潜在空間におけるヒルクライミングの一形態として解釈することができ、モデルが標本を高い確率の領域に向けて反復的に洗練する。
しかし拡散モデルは、局所的に視覚的に整合的であるが、空間の複雑さと最適下初期化のため、局所的に不整合あるいは条件的に不整合である局所最適に収束することが多い。
以前の取り組みでは、誘導信号を強化したり、初期雑音の分布を操作することでこの問題に対処しようとしていた。
Ctrl-Zサンプリング(Ctrl-Z Smpling)は,条件生成時にそのような局所的な最大値を検出して回避する新しいサンプリング手法である。
この手法はまず報酬モデルを用いて潜在的局所的最大値を特定する。
検出すると、ノイズを注入し、前のノイズ状態に戻り、現在の最適化高原から逃れる。
報酬モデルでは、改善を提供するもののみを受け入れ、近くの選択肢が失敗すると、より深い後退がより強力な逃避を可能にする。
この制御されたランダムジグザグプロセスは、前方精錬と後方探査の動的交互化を可能にし、生成した出力のアライメントと視覚的品質の両方を向上する。
提案されているCtrl-Z Smplingはモデルに依存しず、既存の拡散フレームワークと互換性がある。
実験の結果,Ctrl-Zサンプリングは,約7.6倍の関数評価で生成品質を著しく向上することがわかった。
関連論文リスト
- Noise Conditional Variational Score Distillation [60.38982038894823]
騒音条件変化スコア蒸留(NCVSD)は, 予混合拡散モデルから生成消音剤を蒸留する新しい方法である。
この知見を変分スコア蒸留フレームワークに組み込むことで、生成的デノイザのスケーラブルな学習を可能にする。
論文 参考訳(メタデータ) (2025-06-11T06:01:39Z) - A Minimalist Method for Fine-tuning Text-to-Image Diffusion Models [3.8623569699070357]
ノイズPPOは、初期雑音発生器を学習する最小限の強化学習アルゴリズムである。
実験により、ノイズPPOは元のモデルよりもアライメントとサンプル品質を一貫して改善することが示された。
これらの知見は拡散モデルにおける最小主義的RL微調整の実用的価値を裏付けるものである。
論文 参考訳(メタデータ) (2025-05-23T00:01:52Z) - Quantizing Diffusion Models from a Sampling-Aware Perspective [43.95032520555463]
本稿では,混合次軌道アライメント手法を考案したサンプリング対応量子化手法を提案する。
複数のデータセットにまたがるスパースステップ高速サンプリング実験により,本手法は高速サンプリング器の高速収束特性を保っていることが示された。
論文 参考訳(メタデータ) (2025-05-04T20:50:44Z) - Distributional Diffusion Models with Scoring Rules [83.38210785728994]
拡散モデルは高品質な合成データを生成する。
高品質な出力を生成するには、多くの離散化ステップが必要です。
クリーンデータサンプルの後部エム分布を学習し,サンプル生成を実現することを提案する。
論文 参考訳(メタデータ) (2025-02-04T16:59:03Z) - Arbitrary-steps Image Super-resolution via Diffusion Inversion [68.78628844966019]
本研究では,拡散インバージョンに基づく新しい画像超解像(SR)手法を提案する。
本研究では,拡散モデルの中間状態を構築するための部分雑音予測戦略を設計する。
トレーニングが完了すると、このノイズ予測器を使用して、拡散軌道に沿ってサンプリングプロセスを部分的に初期化し、望ましい高分解能結果を生成する。
論文 参考訳(メタデータ) (2024-12-12T07:24:13Z) - Enhancing Diffusion Posterior Sampling for Inverse Problems by Integrating Crafted Measurements [45.70011319850862]
拡散モデルは視覚生成のための強力な基礎モデルとして登場してきた。
現在の後方サンプリングに基づく手法では、測定結果を後方サンプリングに取り込み、対象データの分布を推定する。
本研究は, 早期に高周波情報を早期に導入し, より大きい推定誤差を生じさせることを示す。
工芸品計測を取り入れた新しい拡散後サンプリング手法DPS-CMを提案する。
論文 参考訳(メタデータ) (2024-11-15T00:06:57Z) - Score-based Generative Models with Adaptive Momentum [40.84399531998246]
変換過程を高速化する適応運動量サンプリング法を提案する。
提案手法は,2倍から5倍の速度で,より忠実な画像/グラフを小さなサンプリングステップで作成できることを示す。
論文 参考訳(メタデータ) (2024-05-22T15:20:27Z) - DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for
Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。
我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。
提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文 参考訳(メタデータ) (2023-10-09T15:29:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。