論文の概要: Diffusion Model for Manifold Data: Score Decomposition, Curvature, and Statistical Complexity
- arxiv url: http://arxiv.org/abs/2603.20645v1
- Date: Sat, 21 Mar 2026 04:40:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.014096
- Title: Diffusion Model for Manifold Data: Score Decomposition, Curvature, and Statistical Complexity
- Title(参考訳): マニフォールドデータの拡散モデル:スコア分解, 曲率, 統計的複雑度
- Authors: Zixuan Zhang, Kaixuan Huang, Tuo Zhao, Mengdi Wang, Minshuo Chen,
- Abstract要約: 拡散モデルは、生成モデリングにおける主要なフレームワークとなっている。
本稿では,拡散モデルが構造データをどのように学習するかを,統計的複雑性とデータ幾何学的性質の影響の2つの重要な側面に焦点をあてる。
また、スコア関数の構造と多様体曲率の相互作用も強調する。
- 参考スコア(独自算出の注目度): 93.52679474816728
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have become a leading framework in generative modeling, yet their theoretical understanding -- especially for high-dimensional data concentrated on low-dimensional structures -- remains incomplete. This paper investigates how diffusion models learn such structured data, focusing on two key aspects: statistical complexity and influence of data geometric properties. By modeling data as samples from a smooth Riemannian manifold, our analysis reveals crucial decompositions of score functions in diffusion models under different levels of injected noise. We also highlight the interplay of manifold curvature with the structures in the score function. These analyses enable an efficient neural network approximation to the score function, built upon which we further provide statistical rates for score estimation and distribution learning. Remarkably, the obtained statistical rates are governed by the intrinsic dimension of data and the manifold curvature. These results advance the statistical foundations of diffusion models, bridging theory and practice for generative modeling on manifolds.
- Abstract(参考訳): 拡散モデルは生成モデリングにおいて主要なフレームワークとなっているが、その理論的理解(特に低次元構造に集中した高次元データ)はいまだ不完全である。
本稿では, 拡散モデルがそのような構造化データをどのように学習するかを, 統計的複雑性とデータ幾何学的性質の影響の2つの重要な側面に焦点をあてる。
滑らかなリーマン多様体のサンプルとしてデータをモデル化することにより、異なるレベルのノイズ下での拡散モデルにおけるスコア関数の決定的な分解を明らかにする。
また、スコア関数の構造と多様体曲率の相互作用も強調する。
これらの分析により、スコア関数に対する効率的なニューラルネットワーク近似が可能となり、さらにスコア推定と分布学習のための統計的レートを提供する。
注目すべきは、得られた統計速度は、データの本質的な次元と多様体曲率によって制御されることである。
これらの結果は、拡散モデル、ブリッジ理論、多様体上の生成的モデリングの実践の統計的基礎を前進させる。
関連論文リスト
- Improved Sample Complexity For Diffusion Model Training Without Empirical Risk Minimizer Access [47.96419637803502]
拡散モデルを解析し、$widetildemathcalO(epsilon-4)$に束縛された最先端のサンプル複雑性を提供する。
スコア推定誤差の統計的および最適化成分への構造化分解は、拡散モデルを効率的に訓練する方法に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-05-23T20:02:15Z) - Data augmentation using diffusion models to enhance inverse Ising inference [2.654300333196867]
拡散モデルは、小さなデータセットを増大させることでパラメータ推論を向上させることができることを示す。
本研究は,物理問題におけるデータ拡張に拡散モデルを用いるための概念実証として機能する。
論文 参考訳(メタデータ) (2025-03-13T08:29:17Z) - Continuous Diffusion Model for Language Modeling [64.7425225935854]
離散的データに対する既存の連続拡散モデルは離散的手法と比較して性能が劣る。
本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
本手法は,既存の離散拡散モデルより優れ,自己回帰モデルの性能にアプローチする。
論文 参考訳(メタデータ) (2025-02-17T08:54:29Z) - Dynamical Regimes of Diffusion Models [14.797301819675454]
空間の次元とデータ数が大きい体制における生成拡散モデルについて検討する。
本研究は, 逆向き発生拡散過程における3つの異なる動的状態を明らかにするものである。
崩壊時間の次元とデータ数への依存性は、拡散モデルにおける次元の呪いの徹底的な評価を与える。
論文 参考訳(メタデータ) (2024-02-28T17:19:26Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Analyzing Neural Network-Based Generative Diffusion Models through Convex Optimization [45.72323731094864]
本稿では,2層ニューラルネットワークを用いた拡散モデル解析のための理論的枠組みを提案する。
我々は,1つの凸プログラムを解くことで,スコア予測のための浅層ニューラルネットワークのトレーニングが可能であることを証明した。
本結果は, ニューラルネットワークに基づく拡散モデルが漸近的でない環境で何を学習するかを, 正確に評価するものである。
論文 参考訳(メタデータ) (2024-02-03T00:20:25Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。