論文の概要: Colored Noise Diffusion Sampling
- arxiv url: http://arxiv.org/abs/2605.30332v1
- Date: Thu, 28 May 2026 17:58:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.743389
- Title: Colored Noise Diffusion Sampling
- Title(参考訳): カラーノイズ拡散サンプリング
- Authors: Hadar Davidson, Noam Issachar, Sagie Benaim,
- Abstract要約: 従来の微分方程式 (SDE) の解法は、一様白色雑音を動的に注入することに失敗する。
カラーノイズサンプリング(CNS, Colored Noise Smpling)は, 学習不要な新しい解法である。
CNS は標準的な ODE と SDE を厳格にプラグアンドプレイで推論時サンプリングの代用として上回っている。
- 参考スコア(独自算出の注目度): 9.995104769786805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models achieve state-of-the-art image synthesis, with their generative trajectories fundamentally exhibiting a spectral bias, resolving low-frequency global structures early and high-frequency fine details later. Conventional stochastic differential equation (SDE) solvers fail to account for this dynamic, naively injecting uniform white noise throughout the entire process and misusing the finite energy budget. In this work, we establish a mathematical framework that reconsiders SDE inference as a targeted, frequency-decoupled energy transfer. Leveraging this framework, we introduce Colored Noise Sampling (CNS), a novel, training-free stochastic solver. Rather than injecting uniform white noise, CNS utilizes a dynamic, timestep- and frequency-dependent schedule that more efficiently allocates injected energy toward structurally unresolved frequency bands. By actively exploiting the model's inherent spectral bias, CNS systematically steers the generated distribution toward the true data manifold. Extensive experiments demonstrate that CNS significantly outperforms standard ODE and SDE baselines as a strictly plug-and-play, inference-time sampler substitution across diverse architectures (SiT, JiT, FLUX). Compared to standard sampling on ImageNet-256, CNS achieves substantial unguided FID reductions, improving from 8.26 to 6.27 on SiT-XL/2, 32.39 to 26.69 on JiT-B/16, and 11.88 to 8.31 on JiT-H/16, while yielding consistent relative FID improvements with Classifier-Free Guidance. Project page is available at https://hadardavidson.github.io/CNS/.
- Abstract(参考訳): 拡散モデルは最先端の画像合成を実現し、その生成軌道は基本的にスペクトルバイアスを示し、低周波のグローバル構造を早期に解き、高周波の細部を後述する。
従来の確率微分方程式(SDE)は、プロセス全体を通して均一な白色ノイズを注入し、有限エネルギー予算を誤用し、このダイナミックな現象を説明できない。
本研究では、SDE推論を目標とする周波数分離エネルギー移動として再考する数学的枠組みを確立する。
このフレームワークを活用することで、新しい学習自由確率解法であるColored Noise Smpling (CNS)を導入する。
均一なホワイトノイズを注入するのではなく、CNSは動的、時間ステップ依存、周波数依存のスケジュールを使い、より効率的に注入エネルギーを構造的に未解決の周波数帯域に割り当てる。
モデル固有のスペクトルバイアスを積極的に活用することにより、CNSは生成した分布を真のデータ多様体に向けて体系的に制御する。
CNSは様々なアーキテクチャ(SiT, JiT, FLUX)にまたがる厳密なプラグ・アンド・プレイ・推論・タイム・サンプリング・サブストラクションとして標準ODEとSDEのベースラインを著しく上回っている。
ImageNet-256の標準サンプリングと比較すると、CNSはSiT-XL/2で8.26から6.27に、JT-B/16で32.39から26.69に、JT-H/16で11.88から8.31に改善した。
プロジェクトページはhttps://hadardavidson.github.io/CNS/で公開されている。
関連論文リスト
- Breaking the Bottlenecks: Scalable Diffusion Models for 3D Molecular Generation [0.0]
拡散モデルは分子設計のための強力な生成モデルとして登場した。
彼らの使用は、長いサンプリング軌道、逆過程のばらつき、そして力学の認知における構造的認識の制限によって制限されている。
直接分極拡散モデル(英語版)は、逆MCMC更新を決定論的分極ステップに置き換えることでこれらの非効率性を緩和する。
論文 参考訳(メタデータ) (2026-01-13T20:09:44Z) - FAST: Topology-Aware Frequency-Domain Distribution Matching for Coreset Selection [19.148841575715746]
コアセット選択はデータセットをコンパクトで代表的なサブセットに圧縮し、ディープニューラルネットワークをトレーニングする際のエネルギーと計算負担を軽減する。
DNNフリーな分散マッチングコアセット選択フレームワークであるFASTを提案する。
FASTは評価された全てのベンチマークで最先端のコアセット選択法を著しく上回り、平均精度は9.12%向上した。
論文 参考訳(メタデータ) (2025-11-22T09:24:57Z) - Neural Stochastic Flows: Solver-Free Modelling and Inference for SDE Solutions [23.147474211347856]
我々はニューラルフロー(NSF)とその潜伏変種を導入し、SDE遷移則を直接学習する(最近)。
合成SDEシミュレーションと実世界の追跡とビデオデータを用いた実験により,NSFは数値的アプローチに匹敵する分布精度を維持していることが示された。
論文 参考訳(メタデータ) (2025-10-29T17:59:06Z) - FreqMoE: Dynamic Frequency Enhancement for Neural PDE Solvers [33.5401363681771]
本稿では,低周波成分に対する高周波信号の依存性を利用した,効率的かつプログレッシブなトレーニングフレームワークFreqMoEを提案する。
正規格子PDEと不規則格子PDEの両方の実験により、FreqMoEは16.6%の精度向上を達成した。
論文 参考訳(メタデータ) (2025-05-11T06:06:32Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.23137009609519]
反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文 参考訳(メタデータ) (2024-02-09T01:11:23Z) - Gaussian Mixture Solvers for Diffusion Models [84.83349474361204]
本稿では,拡散モデルのためのGMSと呼ばれる,SDEに基づく新しい解法について紹介する。
画像生成およびストロークベース合成におけるサンプル品質の観点から,SDEに基づく多くの解法よりも優れる。
論文 参考訳(メタデータ) (2023-11-02T02:05:38Z) - Incremental Spatial and Spectral Learning of Neural Operators for
Solving Large-Scale PDEs [86.35471039808023]
Incrmental Fourier Neural Operator (iFNO)を導入し、モデルが使用する周波数モードの数を徐々に増加させる。
iFNOは、各種データセット間の一般化性能を維持したり改善したりしながら、トレーニング時間を短縮する。
提案手法は,既存のフーリエニューラル演算子に比べて20%少ない周波数モードを用いて,10%低いテスト誤差を示すとともに,30%高速なトレーニングを実現する。
論文 参考訳(メタデータ) (2022-11-28T09:57:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。