論文の概要: CAB: Accelerating Flow and Diffusion Sampling via Rectification and Corrected Adams-Bashforth
- arxiv url: http://arxiv.org/abs/2605.16736v2
- Date: Tue, 19 May 2026 04:47:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.470651
- Title: CAB: Accelerating Flow and Diffusion Sampling via Rectification and Corrected Adams-Bashforth
- Title(参考訳): CAB: 整流と修正Adams-Bashforthによる流速・拡散サンプリング
- Authors: Anuska Roy, Pravin Nair,
- Abstract要約: フローと拡散モデルは高忠実で高解像度の画像合成を実現するが、サンプリング時に多くの機能評価(NFE)を必要とすることが多い。
CAB(Corrected Adams-Bashforth)は,フローモデルと拡散モデルの両方を高速化するトレーニング不要のサンプルシステムである。
- 参考スコア(独自算出の注目度): 4.741100658955037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Flow and diffusion models achieve high-fidelity, high-resolution image synthesis, but often require many function evaluations (NFEs) at sampling time. Existing acceleration methods either require additional training through distillation or rely on training-free high-order solvers, and both can degrade sample quality at low NFE budgets. We propose CAB (Corrected Adams-Bashforth), a training-free sampler that accelerates both flow and diffusion models. CAB first transforms the sampling dynamics to a common rectified coordinate system, and then applies a multistep Adams-Bashforth predictor augmented with a simple correction term based on past velocity evaluations and therefore incurs no additional NFEs. The resulting method is simple, has the same algorithmic form across model classes, and has at least third-order local truncation error and second-order global error. Experiments on pretrained flow and diffusion models, including class-conditional and large-scale text-to-image benchmarks, show that CAB improves quality-NFE trade-offs in the low-step regime of 6-20 NFEs. It also remains competitive with strong training-free samplers at higher step counts across most tested models. The official implementation is available at https://github.com/Anuska-Roy/CAB.
- Abstract(参考訳): フローと拡散モデルは高忠実で高解像度の画像合成を実現するが、サンプリング時に多くの機能評価(NFE)を必要とすることが多い。
既存の加速法は蒸留による追加の訓練を必要とするか、トレーニング不要な高次解法に依存しているかのいずれかであり、どちらも低いNFE予算でサンプル品質を劣化させることができる。
CAB(Corrected Adams-Bashforth)は,フローモデルと拡散モデルの両方を高速化するトレーニング不要のサンプルである。
CABはまずサンプリングダイナミクスを共通の整合座標系に変換し、その後、過去の速度評価に基づいて単純な補正項で拡張された多段階のAdams-Bashforth予測子を適用し、従って追加のNFEは発生しない。
得られた手法は単純で、モデルクラス間で同じアルゴリズム形式を持ち、少なくとも3階の局所トラニケーション誤差と2階のグローバルエラーを持つ。
クラス条件および大規模テキスト・ツー・イメージ・ベンチマークを含む事前学習フローおよび拡散モデルの実験により、CABは6-20 NFEの低段階体制における品質-NFEトレードオフを改善していることが示された。
また、ほとんどのテストされたモデルでより高いステップ数でトレーニングなしの強力なサンプルと競合する。
公式実装はhttps://github.com/Anuska-Roy/CAB.comで公開されている。
関連論文リスト
- Joint Distillation for Fast Likelihood Evaluation and Sampling in Flow-based Models [100.28111930893188]
今日の最高の生成モデルの中には、単一の可能性を計算するために、数百から数千の神経機能評価を必要とするものもあります。
本研究では, 高速流動継手蒸留法 (F2D2) を提案し, サンプリングに必要なNFEの数を2桁に減らした。
F2D2はモジュール構造であり、既存のフローベースの数ステップサンプリングモデルと互換性がある。
論文 参考訳(メタデータ) (2025-12-02T10:48:20Z) - DiffusionNFT: Online Diffusion Reinforcement with Forward Process [99.94852379720153]
Diffusion Negative-aware FineTuning (DiffusionNFT) は、フローマッチングを通じて前方プロセス上で直接拡散モデルを最適化する新しいオンラインRLパラダイムである。
DiffusionNFTは、CFGフリーのFlowGRPOよりも25倍効率が高い。
論文 参考訳(メタデータ) (2025-09-19T16:09:33Z) - Truncated Consistency Models [57.50243901368328]
トレーニング一貫性モデルは、PF ODE 軌道に沿ったすべての中間点を対応するエンドポイントにマッピングする学習を必要とする。
このトレーニングパラダイムが一貫性モデルの1ステップ生成性能を制限することを実証的に見出した。
整合性関数の新しいパラメータ化と2段階の訓練手順を提案し,時間外学習が崩壊することを防ぐ。
論文 参考訳(メタデータ) (2024-10-18T22:38:08Z) - Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.51671121528858]
拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。
広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。
本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:43:38Z) - Improving the Training of Rectified Flows [14.652876697052156]
拡散モデルは画像生成とビデオ生成に大いに期待できるが、最先端モデルからのサンプリングには高コストの数値積分が必要である。
この問題に対処するための1つのアプローチは整流流であり、これは繰り返し、トランケーションエラーの影響を受けにくい滑らかなODEパスを学習する。
本研究は,NFEの低い環境下においても,改質流れを訓練するための改良手法を提案する。
改良された改質流は, 整合蒸留, 進行蒸留といった最先端蒸留法を1段階, 2段階で上回った。
論文 参考訳(メタデータ) (2024-05-30T17:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。