論文の概要: Learning to Integrate Diffusion ODEs by Averaging the Derivatives
- arxiv url: http://arxiv.org/abs/2505.14502v1
- Date: Tue, 20 May 2025 15:30:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:53.46267
- Title: Learning to Integrate Diffusion ODEs by Averaging the Derivatives
- Title(参考訳): 導関数を平均化して拡散列を積分する学習
- Authors: Wenze Liu, Xiangyu Yue,
- Abstract要約: この作業は、ODE統合を学習することで、パフォーマンスとコストのバランスをとる中間戦略を提示します。
この損失は、段差を緩やかにセカントまで伸ばすことによって行われるので、セカント・ロスと呼ばれる。
EDMのセカントバージョンはCIFAR-10で2.14ドル、SiT-XL/2のセカントバージョンは2.27ドルである。
- 参考スコア(独自算出の注目度): 9.238684326399497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To accelerate diffusion model inference, numerical solvers perform poorly at extremely small steps, while distillation techniques often introduce complexity and instability. This work presents an intermediate strategy, balancing performance and cost, by learning ODE integration using loss functions derived from the derivative-integral relationship, inspired by Monte Carlo integration and Picard iteration. From a geometric perspective, the losses operate by gradually extending the tangent to the secant, thus are named as secant losses. The secant losses can rapidly convert (via fine-tuning or distillation) a pretrained diffusion model into its secant version. In our experiments, the secant version of EDM achieves a $10$-step FID of $2.14$ on CIFAR-10, while the secant version of SiT-XL/2 attains a $4$-step FID of $2.27$ and an $8$-step FID of $1.96$ on ImageNet-$256\times256$. Code will be available.
- Abstract(参考訳): 拡散モデル推論を高速化するため、数値解法は極めて小さなステップで性能が悪く、蒸留技術は複雑で不安定であることが多い。
この研究は、モンテカルロ積分とピカール反復にインスパイアされた微分積分関係から導かれる損失関数を用いてODE積分を学習することで、性能とコストのバランスをとる中間戦略を示す。
幾何学的な見地からすると、損失は徐々にタンジェントをセカントに伸ばし、セカント損失と呼ばれる。
セカント損失は(微調整や蒸留によって)事前訓練された拡散モデルからセカントバージョンに迅速に変換することができる。
我々の実験では、EDMのセカントバージョンはCIFAR-10で$2.14ドルのFIDを10ドル、SiT-XL/2のセカントバージョンは$4ドル27ドルのFID、ImageNet-$256\times256$を8ドル96ドルのFIDを達成している。
コードは利用可能です。
関連論文リスト
- Unleashing the Power of One-Step Diffusion based Image Super-Resolution via a Large-Scale Diffusion Discriminator [81.81748032199813]
拡散モデルは実世界の超解像(Real-ISR)に優れた性能を示した
SRのための大規模textbfDiscriminator を用いた One-Step textbfDiffusion モデルを提案する。
我々の判別器は、潜伏空間における拡散モデルの任意の時間ステップからノイズのある特徴を抽出することができる。
論文 参考訳(メタデータ) (2024-10-05T16:41:36Z) - Low-overhead magic state distillation with color codes [1.3980986259786223]
非クリフォードゲートのフォールトトレラント実装は、普遍的なフォールトトレラント量子コンピューティングを実現する上で大きな課題である。
本研究では,15-to-1蒸留回路と格子手術に基づく2種類の蒸留方式を提案する。
与えられた目標不確実性に到達するためには、我々のスキームは、カラーコードに対する以前の最高のマジック状態蒸留スキームよりも、およそ2桁少ないリソースを必要とする。
論文 参考訳(メタデータ) (2024-09-12T02:20:17Z) - Scalable 3D Registration via Truncated Entry-wise Absolute Residuals [65.04922801371363]
3ドルの登録アプローチでは、1000万ドル(107ドル)以上のポイントペアを、99%以上のランダムなアウトレイアで処理することができる。
我々はこの手法をTEARと呼び、Trncated Entry-wise Absolute Residualsを演算するoutlier-robust損失を最小限にする。
論文 参考訳(メタデータ) (2024-04-01T04:43:39Z) - ACT-Diffusion: Efficient Adversarial Consistency Training for One-step Diffusion Models [59.90959789767886]
整合性トレーニング損失の最適化は,目標分布と生成分布とのワッサーシュタイン距離を最小化することを示す。
CIFAR10 と ImageNet 64$times$64 と LSUN Cat 256$times$256 データセットの FID スコアを改善する。
論文 参考訳(メタデータ) (2023-11-23T16:49:06Z) - Denoising MCMC for Accelerating Diffusion-Based Generative Models [54.06799491319278]
拡散モデルは、スコア関数を用いて拡散過程の逆をシミュレートし、ノイズからデータを合成する強力な生成モデルである。
本稿では,スコアベースサンプリングを高速化するアプローチを提案する。
DMCMC のインスタンスである Denoising Langevin Gibbs (DLG) が6つの逆S/ODE 計算タスクの高速化に成功していることを示す。
論文 参考訳(メタデータ) (2022-09-29T07:16:10Z) - Poisson Flow Generative Models [9.843778728210427]
ポアソンフロー」生成モデルは、高次元半球上の一様分布を任意のデータ分布にマッピングする。
PFGM は CIFAR-10 上での正規化フローモデルの中で現在の最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-22T17:26:58Z) - Early fault-tolerant simulations of the Hubbard model [3.988614978933934]
ハバードモデルのシミュレーションは、フォールトトレラント量子コンピュータの最初の有用な応用候補である。
本稿では, 分割演算FFFT法に対して, より厳密な境界を与えるトロッタライゼーションによるシミュレーション誤差の有界化に関する新しい解析手法を提案する。
約100万のToffoliゲートを使用して、フォールトトレラントな量子コンピュータに潜在的に有用な応用があることを発見した。
論文 参考訳(メタデータ) (2020-12-16T20:07:54Z) - Langevin Monte Carlo: random coordinate descent and variance reduction [7.464874233755718]
Langevin Monte Carlo (LMC) はベイジアンサンプリング法として人気がある。
LMC上でのRCD(ランダム座標降下)の適用により計算効率を向上させる方法について検討する。
論文 参考訳(メタデータ) (2020-07-26T18:14:36Z) - Minimum optical depth multi-port interferometers for approximating any
unitary transformation and any pure state [52.77024349608834]
任意の次元の純粋な状態は、任意の次元の$d$で、マルチポート干渉計を用いて不忠実な$le 10-15$で作成できることが示される。
The schemes in [Phys. Rev. Lett. textbf73, 58 (1994) and Optica text3, 1460, 1460, but a infidelity in order of 10-7$ for block-diagonal unitary transformations。
論文 参考訳(メタデータ) (2020-02-04T15:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。