論文の概要: Where the Score Lives: A Wavelet View of Diffusion
- arxiv url: http://arxiv.org/abs/2606.08309v1
- Date: Sat, 06 Jun 2026 19:41:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.034833
- Title: Where the Score Lives: A Wavelet View of Diffusion
- Title(参考訳): スコアがどこにあるか: 拡散のウェーブレットビュー
- Authors: Emma Finn, Binxu Wang, T. Anderson Keller, Demba E. Ba,
- Abstract要約: 本稿では,2次元ウェーブレットに基づく拡張を用いたスコア関数のパラメータ化法を提案する。
データ分布のモーメントの観点から解釈可能な最適スコア関数を導出する。
私たちのスコアマシンは、複数のアーキテクチャの関連する帰納バイアスを部分的に模倣するのに十分柔軟です。
- 参考スコア(独自算出の注目度): 7.668216032034199
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Score-based generative models have had remarkable success over the last decade in generating a diverse set of visually plausible images. A variety of architectures including CNNs, U-Nets, and Transformers have been used as the score-approximation network in such diffusion modeling; however, to date, relatively little is known about how these architectural choices impact generative behavior. In this work, to provide insight into this area, we propose an analytically solvable parameterization of the score function using an expansion in a 2D orthogonal wavelet basis. In particular, we derive interpretable optimal score functions in terms of the moments of the data distribution. We use this parametrization to provide an architecture-agnostic, moment-based analysis that reveals which attributes of the data distribution tend to matter most for denoising. Our score machine is flexible enough to partially mimic the relevant inductive biases of multiple architectures, including U-Nets, and CNNs, taking a step towards understanding why different score architectures can exhibit distinct generative behavior. Since our score is solvable in terms of the moments of the data, we can begin to understand how the data distribution interacts with the score network to produce the behavior we observe in diffusion models.
- Abstract(参考訳): スコアベースの生成モデルは、多種多様な視覚的可視画像の生成において、過去10年間に顕著な成功を収めてきた。
CNN、U-Nets、Transformerなどの様々なアーキテクチャは、このような拡散モデリングにおけるスコア近似ネットワークとして使われてきたが、これらのアーキテクチャ選択が生成的挙動にどのように影響するかは、今のところほとんど分かっていない。
本研究では,2次元直交ウェーブレットに基づく拡張を用いたスコア関数のパラメータ化法を提案する。
特に、データ分布のモーメントの観点から、解釈可能な最適スコア関数を導出する。
このパラメトリゼーションを使用して、アーキテクチャに依存しないモーメントベースの分析を提供し、データ分散のどの属性が最も重要かを明らかにする。
我々のスコアマシンは、U-NetやCNNを含む複数のアーキテクチャの関連する帰納バイアスを部分的に模倣するほど柔軟であり、なぜ異なるスコアアーキテクチャが異なる生成挙動を示すのかを理解するための一歩を踏み出した。
我々のスコアはデータのモーメントの観点から解けるので、データ分布がスコアネットワークとどのように相互作用し、拡散モデルで観察した振る舞いを生成するのかを理解し始めることができる。
関連論文リスト
- Agentic Insight Generation in VSM Simulations [4.626393563516877]
本稿では,バリューストリームマップシミュレーションのための分離された2段階のエージェントアーキテクチャを提案する。
データ分析からオーケストレーションを分離することで、システムはドメインエキスパートの知識を取り入れた進歩的なデータ発見を活用する。
複数の最先端の大規模言語モデルの成果は、フレームワークの生存可能性を示している。
論文 参考訳(メタデータ) (2026-04-14T08:11:53Z) - Diffusion Model for Manifold Data: Score Decomposition, Curvature, and Statistical Complexity [93.52679474816728]
拡散モデルは、生成モデリングにおける主要なフレームワークとなっている。
本稿では,拡散モデルが構造データをどのように学習するかを,統計的複雑性とデータ幾何学的性質の影響の2つの重要な側面に焦点をあてる。
また、スコア関数の構造と多様体曲率の相互作用も強調する。
論文 参考訳(メタデータ) (2026-03-21T04:40:19Z) - Dimension-free Score Matching and Time Bootstrapping for Diffusion Models [19.62665684173391]
拡散モデルは、様々な雑音レベルにおける対象分布のスコア関数を推定してサンプルを生成する。
本稿では,マーチンゲールに基づく誤り分解とシャープな分散境界を導入し,従属データから効率的な学習を可能にする。
これらの知見に基づいて,より高い雑音レベルにおいて精度を向上させるために,事前学習したスコアを活用する分散低減手法であるBootstrapped Score Matching (BSM)を提案する。
論文 参考訳(メタデータ) (2025-02-14T18:32:22Z) - Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z) - Probabilistic Tracking with Deep Factors [8.030212474745879]
因子グラフに基づく確率的追跡フレームワークにおける特徴量に対する生成密度と組み合わせたディープ・フィーチャー・エンコーディングの使い方を示す。
本稿では,学習した特徴エンコーダと生成密度を組み合わせる可能性モデルを提案する。
論文 参考訳(メタデータ) (2021-12-02T21:31:51Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。