論文の概要: Dimension-free error estimate for diffusion model and optimal scheduling
- arxiv url: http://arxiv.org/abs/2512.01820v1
- Date: Mon, 01 Dec 2025 15:58:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.943454
- Title: Dimension-free error estimate for diffusion model and optimal scheduling
- Title(参考訳): 拡散モデルと最適スケジューリングのための次元自由誤差推定
- Authors: Valentin de Bortoli, Romuald Elie, Anna Kazeykina, Zhenjie Ren, Jiacheng Zhang,
- Abstract要約: 拡散生成モデルは、経験的に観察された分布から合成データを生成するための強力なツールとして登場した。
従来の分析では、生成したデータと真のデータ分布の誤差を、ワッサーシュタイン距離やクルバック・リーバーの偏差の観点から定量化していた。
本研究では, 生成したデータ分布と真のデータ分布との相違点に有意な次元自由境界を導出する。
- 参考スコア(独自算出の注目度): 22.20348860913421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion generative models have emerged as powerful tools for producing synthetic data from an empirically observed distribution. A common approach involves simulating the time-reversal of an Ornstein-Uhlenbeck (OU) process initialized at the true data distribution. Since the score function associated with the OU process is typically unknown, it is approximated using a trained neural network. This approximation, along with finite time simulation, time discretization and statistical approximation, introduce several sources of error whose impact on the generated samples must be carefully understood. Previous analyses have quantified the error between the generated and the true data distributions in terms of Wasserstein distance or Kullback-Leibler (KL) divergence. However, both metrics present limitations: KL divergence requires absolute continuity between distributions, while Wasserstein distance, though more general, leads to error bounds that scale poorly with dimension, rendering them impractical in high-dimensional settings. In this work, we derive an explicit, dimension-free bound on the discrepancy between the generated and the true data distributions. The bound is expressed in terms of a smooth test functional with bounded first and second derivatives. The key novelty lies in the use of this weaker, functional metric to obtain dimension-independent guarantees, at the cost of higher regularity on the test functions. As an application, we formulate and solve a variational problem to minimize the time-discretization error, leading to the derivation of an optimal time-scheduling strategy for the reverse-time diffusion. Interestingly, this scheduler has appeared previously in the literature in a different context; our analysis provides a new justification for its optimality, now grounded in minimizing the discretization bias in generative sampling.
- Abstract(参考訳): 拡散生成モデルは、経験的に観察された分布から合成データを生成するための強力なツールとして登場した。
一般的なアプローチは、真のデータ分布で初期化されたOrnstein-Uhlenbeck(OU)プロセスの時間反転をシミュレートすることである。
OUプロセスに関連するスコア関数は通常不明であるため、トレーニングされたニューラルネットワークを用いて近似される。
この近似は、有限時間シミュレーション、時間離散化、統計近似とともに、生成されたサンプルへの影響を慎重に理解しなければならないいくつかの誤差源を導入する。
従来の分析では、生成したデータと真のデータ分布の誤差を、ワッサーシュタイン距離やクルバック・リーバー(KL)の偏差の観点から定量化していた。
KL の発散は分布間の絶対連続性を必要とするが、ワッサーシュタイン距離はより一般的には、次元に劣る誤差境界を導いており、高次元の設定では非現実的である。
本研究では, 生成したデータ分布と真のデータ分布との相違点に有意な次元自由境界を導出する。
境界は、有界第一微分と第二微分を持つ滑らかなテスト函数の言葉で表される。
鍵となる新規性は、この弱機能計量を用いて次元に依存しない保証を得ることであり、テスト関数の高正規性(英語版)を犠牲にしている。
応用として、時間分散誤差を最小限に抑えるために変分問題を定式化し解決し、逆時間拡散のための最適時間スケジューリング戦略を導出する。
興味深いことに、このスケジューラは以前、異なる文脈で文献に現れており、我々の分析は、その最適性に対する新たな正当化を提供し、現在では、生成的サンプリングにおける離散化バイアスの最小化に基礎を置いている。
関連論文リスト
- Generative Modeling with Continuous Flows: Sample Complexity of Flow Matching [60.37045080890305]
本稿では,フローマッチングに基づく生成モデルにおいて,サンプルの複雑さを初めて解析する。
速度場推定誤差をニューラルネットワーク近似誤差、有限標本サイズによる統計的誤差、速度場推定のための有限個の最適化ステップによる最適化誤差に分解する。
論文 参考訳(メタデータ) (2025-12-01T05:14:25Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Non-asymptotic bounds for forward processes in denoising diffusions: Ornstein-Uhlenbeck is hard to beat [49.1574468325115]
本稿では,全変動(TV)における前方拡散誤差の非漸近的境界について述べる。
我々は、R$からFarthestモードまでの距離でマルチモーダルデータ分布をパラメライズし、加法的および乗法的雑音による前方拡散を考察する。
論文 参考訳(メタデータ) (2024-08-25T10:28:31Z) - KL Convergence Guarantees for Score diffusion models under minimal data assumptions [9.618473763561418]
注目すべき課題は、包括的な定量的結果の欠如という形で続いている。
この記事では、Ornstein-Uhlenbeck半群とその運動論的対応から生じる一定のステップサイズを持つスコア拡散モデルに焦点を当てる。
論文 参考訳(メタデータ) (2023-08-23T16:31:08Z) - On the Generalization and Approximation Capacities of Neural Controlled Differential Equations [0.3222802562733786]
Neural Controlled Differential Equations (NCDE) は、不規則サンプル時系列を用いた教師あり学習のための最先端のツールである。
ニューラルネット上の古典的近似結果がNCDEにどのように移行するかを示す。
論文 参考訳(メタデータ) (2023-05-26T10:02:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。