Fugu-MT 論文翻訳(概要): On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs)

論文の概要: On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs)

arxiv url: http://arxiv.org/abs/2407.01079v2
Date: Thu, 22 Aug 2024 06:25:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-23 18:56:04.277735
Title: On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs)
Title（参考訳）: 潜伏拡散変圧器(DiTs)の統計的速度と有効基準について
Authors: Jerry Yao-Chieh Hu, Weimin Wu, Zhao Song, Han Liu,
Abstract要約: 低次元線形潜時空間仮定の下で、潜時テキストbfDiffusion textbfTransformers(textbfDiTs)の限界について検討する。具体的には、潜時空間次元のサブ線形である潜時DiTのスコアネットワークに対して、近似誤差を導出する。
参考スコア（独自算出の注目度）: 12.810268045479992
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We investigate the statistical and computational limits of latent \textbf{Di}ffusion \textbf{T}ransformers (\textbf{DiT}s) under the low-dimensional linear latent space assumption. Statistically, we study the universal approximation and sample complexity of the DiTs score function, as well as the distribution recovery property of the initial data. Specifically, under mild data assumptions, we derive an approximation error bound for the score network of latent DiTs, which is sub-linear in the latent space dimension. Additionally, we derive the corresponding sample complexity bound and show that the data distribution generated from the estimated score function converges toward a proximate area of the original one. Computationally, we characterize the hardness of both forward inference and backward computation of latent DiTs, assuming the Strong Exponential Time Hypothesis (SETH). For forward inference, we identify efficient criteria for all possible latent DiTs inference algorithms and showcase our theory by pushing the efficiency toward almost-linear time inference. For backward computation, we leverage the low-rank structure within the gradient computation of DiTs training for possible algorithmic speedup. Specifically, we show that such speedup achieves almost-linear time latent DiTs training by casting the DiTs gradient as a series of chained low-rank approximations with bounded error. Under the low-dimensional assumption, we show that the convergence rate and the computational efficiency are both dominated by the dimension of the subspace, suggesting that latent DiTs have the potential to bypass the challenges associated with the high dimensionality of initial data.
Abstract（参考訳）: 低次元線形ラテント空間仮定の下で、潜伏型 \textbf{Di}ffusion \textbf{T}ransformers (\textbf{DiT}s) の統計的および計算的限界について検討する。統計的には,DiTsスコア関数の普遍近似とサンプル複雑性,および初期データの分布回復特性について検討する。具体的には、軽度のデータ仮定の下では、潜時空間次元のサブ線形である潜時DiTのスコアネットワークに対して近似誤差を導出する。さらに、対応するサンプルの複雑性境界を導出し、推定スコア関数から生成されたデータ分布が元の値の近距離領域に収束することを示す。計算学的には、Strong Exponential Time hypothesis (SETH) を仮定して、前向き推論と遅延DiTの後方計算の両方の硬さを特徴付ける。フォワード推論では,全ての遅延DiTs推論アルゴリズムの効率的な基準を特定し,その効率をほぼ線形時間推論に推し進めることで理論を実証する。逆向きの計算では、アルゴリズムの高速化のために、DiTsトレーニングの勾配計算の低ランク構造を利用する。具体的には、Dits勾配を一連の鎖状低ランク近似として有界誤差でキャストすることにより、ほぼ直線的なDiTsトレーニングを実現することを示す。低次元の仮定では、収束速度と計算効率が共に部分空間の次元に支配されていることが示され、遅延DiTは初期データの高次元性に関連する課題を回避できる可能性が示唆された。

関連論文リスト

Multi-Dimensional Visual Data Recovery: Scale-Aware Tensor Modeling and Accelerated Randomized Computation [51.65236537605077]
我々は,新しいタイプのネットワーク圧縮最適化手法,完全ランダム化テンソルネットワーク圧縮(FCTN)を提案する。 FCTNは多次元データ処理と解析において顕著な業績を残している。定式化モデルの解法を保証した効率的なアルゴリズムを導出する。
論文参考訳（メタデータ） (2026-02-13T14:56:37Z)
Generative Modeling with Continuous Flows: Sample Complexity of Flow Matching [60.37045080890305]
本稿では,フローマッチングに基づく生成モデルにおいて,サンプルの複雑さを初めて解析する。速度場推定誤差をニューラルネットワーク近似誤差、有限標本サイズによる統計的誤差、速度場推定のための有限個の最適化ステップによる最適化誤差に分解する。
論文参考訳（メタデータ） (2025-12-01T05:14:25Z)
Modes of Sequence Models and Learning Coefficients [0.6906005491572401]
変換器ネットワークにおける損失ランドスケープの計測可能な特性とデータ中のパターンをリンクするシーケンスモデリングの幾何学的記述を開発する。局所学習係数の推定値がデータ依存しきい値以下のモードに無関心であることを理論的に示す。この洞察は、ネットワークパラメータが人口減少の厳格な最小限ではない場合でも、なぜ信頼できるLLC推定値が得られるのかを明らかにする。
論文参考訳（メタデータ） (2025-04-25T03:38:10Z)
Fast and Provable Tensor-Train Format Tensor Completion via Precondtioned Riemannian Gradient Descent [4.376623639964006]
本稿では, テンソルトレイン(TT)フォーマットに基づく低ランクテンソル完成問題について検討する。本稿では,TTランクの低いテンソル補完を解き,その線形収束を確立するために,事前条件付き勾配降下アルゴリズム(PRGD)を提案する。ハイパースペクトル画像補完や量子状態トモグラフィなどの実用的な応用では、PRGDアルゴリズムは繰り返し回数を大幅に削減し、計算時間を劇的に短縮する。
論文参考訳（メタデータ） (2025-01-23T05:03:50Z)
Bounds in Wasserstein Distance for Locally Stationary Processes [0.29771206318712146]
本研究では,局所定常(LSP)データに適した条件付き確率分布推定器を提案する。我々は、ワーッサーシュタイン計量の下で、NWに基づく条件付き確率推定器の収束率を厳格に設定する。合成データセットの広範な数値シミュレーションを行い,実世界のデータを用いた実証検証を行った。
論文参考訳（メタデータ） (2024-12-04T15:51:22Z)
On Statistical Rates of Conditional Diffusion Transformers: Approximation, Estimation and Minimax Optimality [15.889816082916722]
条件付きDiTと潜伏変種の両方が、特定条件下での非条件付きDiTの最小最適性をもたらすことを示す。本研究は, 条件付きおよび非条件付きDiTの統計的限界を確立し, より効率的かつ高精度なDiTモデル開発に向けた実践的ガイダンスを提供する。
論文参考訳（メタデータ） (2024-11-26T15:30:48Z)
Building Conformal Prediction Intervals with Approximate Message Passing [14.951392270119461]
等角予測は、分布のない方法で有効な予測間隔を構築するための強力なツールである。本稿では,予測間隔の計算を高速化するために,AMP(Adroximate Message Passing)に基づく新しいアルゴリズムを提案する。提案手法では,基準値に近い予測間隔が生成され,精度は桁違いに向上した。
論文参考訳（メタデータ） (2024-10-21T20:34:33Z)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
The statistics properties of Temporal difference learning with Polyak-Ruppert averaging。現在の最先端の成果を改善するために,3つの重要なコントリビューションを行います。
論文参考訳（メタデータ） (2024-10-21T15:34:44Z)
Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文参考訳（メタデータ） (2024-08-25T04:07:18Z)
Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文参考訳（メタデータ） (2023-11-02T06:09:24Z)
Flow-based Distributionally Robust Optimization [23.232731771848883]
We present a framework, called $textttFlowDRO$, for solve flow-based distributionally robust optimization (DRO) problem with Wasserstein uncertainty set。我々は、連続した最悪のケース分布(Last Favorable Distribution, LFD)とそれからのサンプルを見つけることを目指している。本稿では、逆学習、分布論的に堅牢な仮説テスト、およびデータ駆動型分布摂動差分プライバシーの新しいメカニズムを実証する。
論文参考訳（メタデータ） (2023-10-30T03:53:31Z)
Score Approximation, Estimation and Distribution Recovery of Diffusion Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文参考訳（メタデータ） (2023-02-14T17:02:35Z)
Rigorous dynamical mean field theory for stochastic gradient descent methods [17.90683687731009]
一階勾配法の一家系の正確な高次元に対する閉形式方程式を証明した。これには勾配降下(SGD)やネステロフ加速度などの広く使われているアルゴリズムが含まれる。
論文参考訳（メタデータ） (2022-10-12T21:10:55Z)
Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。これらの結果はサンプル状態と有限状態の両方で定式化する。
論文参考訳（メタデータ） (2022-10-03T06:09:01Z)
Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文参考訳（メタデータ） (2022-02-23T06:11:49Z)
Comparing Probability Distributions with Conditional Transport [63.11403041984197]
新しい発散として条件輸送(CT)を提案し、償却されたCT(ACT)コストと近似します。 ACTは条件付き輸送計画の計算を補正し、計算が容易な非バイアスのサンプル勾配を持つ。さまざまなベンチマークデータセットのジェネレーティブモデリングでは、既存のジェネレーティブ敵対ネットワークのデフォルトの統計距離をACTに置き換えることで、一貫してパフォーマンスを向上させることが示されています。
論文参考訳（メタデータ） (2020-12-28T05:14:22Z)
Tensor Train Random Projection [0.0]
本研究は、次元減少のための新しいテンソルトレインランダムプロジェクション(TTRP)法を提案する。我々のTTRPは、TTランクが1に等しいテンソルトレイン表現によって体系的に構築されている。テンソルトレイン形式に基づいて、この新しいランダムプロジェクション法は、高次元データセットの次元削減手順を高速化することができる。
論文参考訳（メタデータ） (2020-10-21T07:31:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。