論文の概要: A Unification of Discrete, Gaussian, and Simplicial Diffusion
- arxiv url: http://arxiv.org/abs/2512.15923v1
- Date: Wed, 17 Dec 2025 19:39:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.795519
- Title: A Unification of Discrete, Gaussian, and Simplicial Diffusion
- Title(参考訳): 離散, ガウス, 単純拡散の統一
- Authors: Nuria Alina Chandra, Yucen Lily Li, Alan N. Amin, Alex Ali, Joshua Rollins, Sebastian W. Ober, Aniruddh Raghu, Andrew Gordon Wilson,
- Abstract要約: Wright-Fisher simplicial diffusion はより安定であり、条件付きDNA 生成における従来のsimplicial diffusion モデルよりも優れていることを示す。
また、個々のドメインでトレーニングされたモデルと競合する複数のドメインでモデルを一度にトレーニングできることも示しています。
- 参考スコア(独自算出の注目度): 32.86558714543654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To model discrete sequences such as DNA, proteins, and language using diffusion, practitioners must choose between three major methods: diffusion in discrete space, Gaussian diffusion in Euclidean space, or diffusion on the simplex. Despite their shared goal, these models have disparate algorithms, theoretical structures, and tradeoffs: discrete diffusion has the most natural domain, Gaussian diffusion has more mature algorithms, and diffusion on the simplex in principle combines the strengths of the other two but in practice suffers from a numerically unstable stochastic processes. Ideally we could see each of these models as instances of the same underlying framework, and enable practitioners to switch between models for downstream applications. However previous theories have only considered connections in special cases. Here we build a theory unifying all three methods of discrete diffusion as different parameterizations of the same underlying process: the Wright-Fisher population genetics model. In particular, we find simplicial and Gaussian diffusion as two large-population limits. Our theory formally connects the likelihoods and hyperparameters of these models and leverages decades of mathematical genetics literature to unlock stable simplicial diffusion. Finally, we relieve the practitioner of balancing model trade-offs by demonstrating it is possible to train a single model that can perform diffusion in any of these three domains at test time. Our experiments show that Wright-Fisher simplicial diffusion is more stable and outperforms previous simplicial diffusion models on conditional DNA generation. We also show that we can train models on multiple domains at once that are competitive with models trained on any individual domain.
- Abstract(参考訳): 拡散を用いたDNA、タンパク質、言語などの離散配列をモデル化するために、実践者は、離散空間での拡散、ユークリッド空間でのガウス拡散、単純体での拡散の3つの主要な方法を選択する必要がある。
離散拡散は最も自然な領域を持ち、ガウス拡散はより成熟したアルゴリズムを持ち、原理上の単純体上の拡散は他の2つの強みを結合するが、実際には数値的に不安定な確率過程に苦しむ。
理想的には、これらのモデルはそれぞれ同じ基盤となるフレームワークのインスタンスとして見ることができ、実践者が下流アプリケーションのためにモデルを切り替えることができます。
しかし、それ以前の説は特別な場合にのみ関係を考慮されていた。
ここでは、同じプロセスの異なるパラメータ化として、離散拡散の3つのメソッドを統一する理論を構築します。
特に、simplicial と Gaussian の拡散は2つの大きな人口制限である。
我々の理論は、これらのモデルの可能性とハイパーパラメータを正式に結合し、何十年もの数学的遺伝学の文献を活用して、安定な単体拡散を解き放つ。
最後に、テスト時にこれらの3つのドメインのいずれかで拡散できる単一のモデルをトレーニングできることを実証することで、モデルのトレードオフのバランスをとる実践者を安心させます。
実験の結果, ライト・フィッシャー単体拡散はより安定であり, 条件付きDNA生成における従来の単体拡散モデルよりも優れていた。
また、個々のドメインでトレーニングされたモデルと競合する複数のドメインでモデルを一度にトレーニングできることも示しています。
関連論文リスト
- Resolving Memorization in Empirical Diffusion Model for Manifold Data in High-Dimensional Spaces [5.716752583983991]
データ分布がn個の点からなる場合、経験的拡散モデルは既存のデータ点を再現する傾向がある。
本研究は,経験的拡散シミュレーションの最後に慣性更新を適用することで,記憶の問題を解くことができることを示す。
このモデルから得られたサンプルの分布は、次元$d$の$C2$多様体上の真のデータ分布を、位数$O(n-frac2d+4)$のWasserstein-1距離内で近似することを示した。
論文 参考訳(メタデータ) (2025-05-05T09:40:41Z) - Continuous Diffusion Model for Language Modeling [64.7425225935854]
離散的データに対する既存の連続拡散モデルは離散的手法と比較して性能が劣る。
本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
本手法は,既存の離散拡散モデルより優れ,自己回帰モデルの性能にアプローチする。
論文 参考訳(メタデータ) (2025-02-17T08:54:29Z) - Guided Diffusion from Self-Supervised Diffusion Features [49.78673164423208]
ガイダンスは拡散モデルにおいて重要な概念として機能するが、その効果は追加のデータアノテーションや事前学習の必要性によって制限されることが多い。
本稿では,拡散モデルからガイダンスを抽出するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:19:11Z) - Renormalizing Diffusion Models [0.7252027234425334]
拡散モデルを用いて、統計および量子場理論の逆再正規化群フローを学習する。
我々の研究は、多スケール拡散モデルの解釈を提供し、新しい性質を持つべき拡散モデルに対する物理的に着想を得た提案を与える。
論文 参考訳(メタデータ) (2023-08-23T18:02:31Z) - Lipschitz Singularities in Diffusion Models [64.28196620345808]
拡散モデルは、零点付近の時間変数に関して、しばしばネットワークの無限のリプシッツ特性を示す。
ゼロ点近傍の拡散モデルのリプシッツ特異点を緩和する新しい手法 E-TSDM を提案する。
我々の研究は、一般拡散過程の理解を深め、拡散モデルの設計に関する洞察を提供するかもしれない。
論文 参考訳(メタデータ) (2023-06-20T03:05:28Z) - Unifying Diffusion Models' Latent Space, with Applications to
CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。
テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。