Fugu-MT 論文翻訳(概要): Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure

論文の概要: Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure

arxiv url: http://arxiv.org/abs/2410.24060v4
Date: Fri, 22 Nov 2024 02:48:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.908301
Title: Understanding Generalizability of Diffusion Models Requires Rethinking the Hidden Gaussian Structure
Title（参考訳）: 拡散モデルの一般化可能性を理解するには隠れたガウス構造を再考する必要がある
Authors: Xiang Li, Yixiang Dai, Qing Qu,
Abstract要約: 学習したスコア関数の隠れた性質を調べた結果,拡散モデルの一般化可能性について検討した。拡散モデルが記憶から一般化へと遷移するにつれて、対応する非線形拡散デノイザは線形性を増加させる。
参考スコア（独自算出の注目度）: 8.320632531909682
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In this work, we study the generalizability of diffusion models by looking into the hidden properties of the learned score functions, which are essentially a series of deep denoisers trained on various noise levels. We observe that as diffusion models transition from memorization to generalization, their corresponding nonlinear diffusion denoisers exhibit increasing linearity. This discovery leads us to investigate the linear counterparts of the nonlinear diffusion models, which are a series of linear models trained to match the function mappings of the nonlinear diffusion denoisers. Surprisingly, these linear denoisers are approximately the optimal denoisers for a multivariate Gaussian distribution characterized by the empirical mean and covariance of the training dataset. This finding implies that diffusion models have the inductive bias towards capturing and utilizing the Gaussian structure (covariance information) of the training dataset for data generation. We empirically demonstrate that this inductive bias is a unique property of diffusion models in the generalization regime, which becomes increasingly evident when the model's capacity is relatively small compared to the training dataset size. In the case that the model is highly overparameterized, this inductive bias emerges during the initial training phases before the model fully memorizes its training data. Our study provides crucial insights into understanding the notable strong generalization phenomenon recently observed in real-world diffusion models.
Abstract（参考訳）: 本研究では,学習したスコア関数の隠れ特性を調べ,拡散モデルの一般化可能性について検討する。拡散モデルが記憶から一般化へと遷移するにつれて, 対応する非線形拡散復号器が線形性を高めることが観察された。この発見により、非線形拡散デノイザの関数写像に一致するように訓練された一連の線形モデルである非線形拡散モデルの線形モデルについて検討する。驚くべきことに、これらの線形デノイザーは、トレーニングデータセットの経験的平均と共分散によって特徴づけられる多変量ガウス分布の最適デノイザーである。この発見は、拡散モデルが、データ生成のためのトレーニングデータセットのガウス構造(共分散情報)を捉え、利用するための誘導バイアスを持っていることを示唆している。この帰納バイアスが一般化体制における拡散モデルのユニークな性質であることを実証的に実証し、モデルのキャパシティがトレーニングデータセットサイズに比べて比較的小さい場合には、ますます明らかになる。モデルが高度にパラメータ化されている場合、モデルがトレーニングデータを完全記憶する前に、この誘導バイアスが最初のトレーニングフェーズの間に出現する。実世界の拡散モデルで最近観測された顕著な強い一般化現象を理解する上で,本研究では重要な知見を提供する。

関連論文リスト

Diffusion Model's Generalization Can Be Characterized by Inductive Biases toward a Data-Dependent Ridge Manifold [19.059115911590776]
対数密度リッジ多様体を提案することにより、拡散モデルが生成するものを明示的に特徴づける。生成したデータは、推論ダイナミクスが進むにつれて、この多様体にどのように関係するかを示す。トレーニングダイナミクスのより詳細な理解は、生成帰納バイアスのより正確な定量化につながる。
論文参考訳（メタデータ） (2026-02-05T18:55:03Z)
Diffusion models under low-noise regime [3.729242965449096]
拡散モデルは, 汚損レベルが小さい場合に有効であることを示す。トレーニングセットのサイズ,データ幾何,および客観選択形状のモデル化方法の定量化を行う。この研究は、実用的なアプリケーションにおける生成モデルの信頼性に対する理解のギャップに対処し始めます。
論文参考訳（メタデータ） (2025-06-09T15:07:16Z)
Deeper Diffusion Models Amplify Bias [54.8794775172033]
本稿では,拡散モデルにおけるバイアス分散トレードオフの概念について考察する。 1つの極端な場合、拡散モデルはトレーニングデータの固有のバイアスを増幅し、もう1つの場合、トレーニングサンプルの想定されるプライバシーを損なう可能性がある。
論文参考訳（メタデータ） (2025-05-23T07:08:09Z)
Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文参考訳（メタデータ） (2025-05-22T10:01:59Z)
Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning [79.65014491424151]
量子離散化拡散確率モデル(QD3PM)を提案する。これは、指数関数的に大きなヒルベルト空間における拡散と denoising を通じて合同確率学習を可能にする。本稿では,共同分布学習における量子的優位性を生かして,生成モデルの新たな理論的パラダイムを確立する。
論文参考訳（メタデータ） (2025-05-08T11:48:21Z)
Generalization through variance: how noise shapes inductive biases in diffusion models [0.0]
我々は「分散による一般化」現象を部分的に説明できる数学的理論を開発した。分布拡散モデルでは, トレーニング分布に類似したサンプルを効果的に学習する。また、この帰納バイアスが特徴に関連した帰納バイアスとどのように相互作用するかを特徴付ける。
論文参考訳（メタデータ） (2025-04-16T23:41:10Z)
Critical Iterative Denoising: A Discrete Generative Model Applied to Graphs [52.50288418639075]
本稿では, 個別拡散を単純化し, 時間とともに条件付き独立性を仮定することで問題を回避できる, イテレーティブ・デノナイジング(Iterative Denoising)という新しい枠組みを提案する。実験により,提案手法はグラフ生成タスクにおいて既存の離散拡散ベースラインを著しく上回ることを示す。
論文参考訳（メタデータ） (2025-03-27T15:08:58Z)
An Analytical Theory of Power Law Spectral Bias in the Learning Dynamics of Diffusion Models [2.1756081703276]
拡散モデル学習中に学習した分布がどのように進化するかを理解するための分析フレームワークを開発した。任意のデータを用いた1層または2層線形デノイザ設定における重みの勾配-流れの正確な解を導出した。これらの解により、閉形式で生成された分布とKLの発散を訓練によって導出できる。
論文参考訳（メタデータ） (2025-03-05T05:50:38Z)
Continuous Diffusion Model for Language Modeling [57.396578974401734]
離散データに対する既存の連続拡散モデルは、離散的アプローチと比較して性能が限られている。本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-17T08:54:29Z)
Understanding Representation Dynamics of Diffusion Models via Low-Dimensional Modeling [25.705179111920806]
拡散モデルにおける一様表現ダイナミクスの出現について検討する。この一様性は、ノイズスケールをまたいだデノイング強度とクラス信頼の相互作用から生じる。分類タスクにおいて、一助動学の存在は、確実に一般化を示す。
論文参考訳（メタデータ） (2025-02-09T01:58:28Z)
On the Relation Between Linear Diffusion and Power Iteration [42.158089783398616]
相関機械として生成過程を研究する」生成過程の早い段階で低周波が出現し, 固有値に依存する速度で, 偏極基底ベクトルが真のデータにより整合していることが示される。このモデルにより、線形拡散モデルが、一般的な電力反復法と同様に、基礎データの先頭固有ベクトルに平均的に収束することを示すことができる。
論文参考訳（メタデータ） (2024-10-16T07:33:12Z)
Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文参考訳（メタデータ） (2023-12-14T11:19:11Z)
On the Generalization Properties of Diffusion Models [33.93850788633184]
この研究は拡散モデルの一般化特性を包括的に理論的に探求することを目的としている。我々は、スコアベース拡散モデルのトレーニング力学と合わせて、タンデムで進化する一般化ギャップの理論的推定値を確立する。我々は定量分析をデータ依存のシナリオに拡張し、対象の分布を密度の連続として表現する。
論文参考訳（メタデータ） (2023-11-03T09:20:20Z)
The Emergence of Reproducibility and Generalizability in Diffusion Models [10.188731323681575]
同じスタートノイズ入力と決定論的サンプリングが与えられた場合、異なる拡散モデルはしばしば驚くほど類似した出力が得られる。拡散モデルはトレーニングデータサイズの影響を受けやすい分布を学習していることを示す。この価値ある性質は、条件付き使用、逆問題解決、モデル微調整など、拡散モデルの多くの変種に一般化される。
論文参考訳（メタデータ） (2023-10-08T19:02:46Z)
Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion Models [76.46246743508651]
我々は,現在の拡散モデルが後方認知において表現力のあるボトルネックを持っていることを示した。本稿では,後方復調のための表現的かつ効率的なモデルであるソフトミキシング・デノナイジング(SMD)を導入する。
論文参考訳（メタデータ） (2023-09-25T12:03:32Z)
Diff-Instruct: A Universal Approach for Transferring Knowledge From Pre-trained Diffusion Models [77.83923746319498]
本稿では,任意の生成モデルの学習を指導するDiff-Instructというフレームワークを提案する。 Diff-Instructは、最先端の単一ステップ拡散モデルであることを示す。 GANモデルの精製実験により、Diff-InstructはGANモデルの事前訓練されたジェネレータを一貫して改善できることが示されている。
論文参考訳（メタデータ） (2023-05-29T04:22:57Z)
On the Generalization of Diffusion Model [42.447639515467934]
生成したデータとトレーニングセットの相互情報によって測定される生成モデルの一般化を定義する。実験的最適拡散モデルでは, 決定論的サンプリングによって生成されたデータは, すべてトレーニングセットに強く関連しており, 一般化が不十分であることを示す。本稿では,経験的最適解が一般化問題を持たない別の学習目標を提案する。
論文参考訳（メタデータ） (2023-05-24T04:27:57Z)
Diffusion Models are Minimax Optimal Distribution Estimators [49.47503258639454]
拡散モデリングの近似と一般化能力について、初めて厳密な分析を行った。実密度関数がベソフ空間に属し、経験値整合損失が適切に最小化されている場合、生成したデータ分布は、ほぼ最小の最適推定値が得られることを示す。
論文参考訳（メタデータ） (2023-03-03T11:31:55Z)
Information-Theoretic Diffusion [18.356162596599436]
拡散モデルのデノイングは密度モデリングや画像生成において大きな進歩をもたらした。情報理論における古典的な結果にインスパイアされた拡散モデルのための新しい数学的基礎を導入する。
論文参考訳（メタデータ） (2023-02-07T23:03:07Z)
Diffusion Models in Vision: A Survey [80.82832715884597]
拡散モデルは、前方拡散段階と逆拡散段階の2つの段階に基づく深層生成モデルである。拡散モデルは、既知の計算負荷にもかかわらず、生成したサンプルの品質と多様性に対して広く評価されている。
論文参考訳（メタデータ） (2022-09-10T22:00:30Z)
How Much is Enough? A Study on Diffusion Times in Score-based Generative Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文参考訳（メタデータ） (2022-06-10T15:09:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。