論文の概要: Unified Control for Inference-Time Guidance of Denoising Diffusion Models
- arxiv url: http://arxiv.org/abs/2512.12339v1
- Date: Sat, 13 Dec 2025 14:12:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.223494
- Title: Unified Control for Inference-Time Guidance of Denoising Diffusion Models
- Title(参考訳): 騒音拡散モデルの推論時間誘導のための統一制御
- Authors: Maurya Goyal, Anuj Singh, Hadi Jamali-Rad,
- Abstract要約: 我々は、サンプリングと勾配に基づくガイダンスの長所を統一されたフレームワークにまとめるユニバーサルアルゴリズムUniCoDeを提案する。
そこで本研究では,サンプリングと勾配に基づくガイダンスの長所を統一したフレームワークに組み込んだユニバーサルアルゴリズムUniCoDeを提案する。
- 参考スコア(独自算出の注目度): 4.2566707664597
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aligning diffusion model outputs with downstream objectives is essential for improving task-specific performance. Broadly, inference-time training-free approaches for aligning diffusion models can be categorized into two main strategies: sampling-based methods, which explore multiple candidate outputs and select those with higher reward signals, and gradient-guided methods, which use differentiable reward approximations to directly steer the generation process. In this work, we propose a universal algorithm, UniCoDe, which brings together the strengths of sampling and gradient-based guidance into a unified framework. UniCoDe integrates local gradient signals during sampling, thereby addressing the sampling inefficiency inherent in complex reward-based sampling approaches. By cohesively combining these two paradigms, UniCoDe enables more efficient sampling while offering better trade-offs between reward alignment and divergence from the diffusion unconditional prior. Empirical results demonstrate that UniCoDe remains competitive with state-of-the-art baselines across a range of tasks. The code is available at https://github.com/maurya-goyal10/UniCoDe
- Abstract(参考訳): 下流目標を用いた拡散モデル出力の調整は,タスク固有性能の向上に不可欠である。
広範に、拡散モデルを調整するための推論時トレーニングフリーアプローチは、複数の候補出力を探索して高い報酬信号を選択するサンプリングベース手法と、微分可能な報酬近似を用いて生成プロセスを直接操縦する勾配誘導手法の2つの主要な戦略に分類することができる。
そこで本研究では,サンプリングと勾配に基づくガイダンスの長所を統一したフレームワークに組み込んだユニバーサルアルゴリズムUniCoDeを提案する。
UniCoDeはサンプリング中の局所勾配信号を統合し、複雑な報酬に基づくサンプリング手法に固有のサンプリング非効率に対処する。
これらの2つのパラダイムを結合的に組み合わせることで、UniCoDeはより効率的なサンプリングを可能にし、報酬アライメントと拡散未条件前の拡散から分岐する間のトレードオフをより良くする。
実証的な結果は、UniCoDeがさまざまなタスクで最先端のベースラインと競争し続けていることを示している。
コードはhttps://github.com/maurya-goyal10/UniCoDeで公開されている。
関連論文リスト
- G$^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.21206048155669]
本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラー-GRPO(G$2$RPO)フレームワークを提案する。
複数の拡散スケールで計算された利点を集約するマルチグラニュラリティ・アドバンテージ・インテグレーション・モジュールを導入する。
G$2$RPOは既存のフローベースGRPOベースラインを著しく上回る。
論文 参考訳(メタデータ) (2025-10-02T12:57:12Z) - Sampling by averaging: A multiscale approach to score estimation [4.003851730099099]
複雑で正規化されていないターゲット分布から,マルチスケールのダイナミックスを活用することで,効率的なサンプリングを行うための新しいフレームワークを提案する。
MultALMCとMultCDiffの2つのアルゴリズムが開発された。
このフレームワークは、学生のtベースのノイズモデルと調整された高速プロセスダイナミクスを用いて、重次元のターゲット分布を扱うように拡張されている。
論文 参考訳(メタデータ) (2025-08-20T21:09:34Z) - Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [70.8832906871441]
我々は、モデルを再訓練することなく、所望の報酬に向けて世代を操る方法を研究する。
従来の手法では、通常は1つの認知軌道内でサンプリングやフィルタを行い、軌道レベルの改善なしに報酬をステップバイステップで最適化する。
本稿では,拡散言語モデル(PG-DLM)の粒子ギブスサンプリングについて紹介する。
論文 参考訳(メタデータ) (2025-07-11T08:00:47Z) - Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering [18.543769006014383]
拡散モデルはしばしば、サンプリング軌跡に固有の変化のために、一貫性のないサンプル品質を示す。
CFG-リジェクション(CFG-Rejection)は,デノナイジングプロセスの初期段階において,低品質なサンプルをフィルタリングする効率的なプラグアンドプレイ戦略である。
画像生成におけるCFG-Rejectionの有効性を広範囲な実験により検証する。
論文 参考訳(メタデータ) (2025-05-29T11:08:24Z) - Training-free Diffusion Model Alignment with Sampling Demons [15.400553977713914]
提案手法は,報酬関数やモデル再学習を介さずに,推論時の復調過程を導出するための最適化手法である。
提案手法は,高報酬に対応する領域の密度を最適化することにより,雑音分布の制御を行う。
実験の結果,提案手法は平均的美学のテキスト・ツー・イメージ生成を著しく改善することがわかった。
論文 参考訳(メタデータ) (2024-10-08T07:33:49Z) - Improved off-policy training of diffusion samplers [93.66433483772055]
本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-07T18:51:49Z) - Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。
本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。
本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2023-10-06T06:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。