論文の概要: Dynamical Regimes of Multimodal Diffusion Models
- arxiv url: http://arxiv.org/abs/2602.04780v1
- Date: Wed, 04 Feb 2026 17:16:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.654541
- Title: Dynamical Regimes of Multimodal Diffusion Models
- Title(参考訳): 多モード拡散モデルの動的レジーム
- Authors: Emil Albrychiewicz, Andrés Franco Valiente, Li-Ching Chen,
- Abstract要約: 本稿では,Ornstein-Uhlenbeck過程をトラクタブルモデルとして用いた,結合拡散モデルの理論的枠組みを提案する。
重要な予測は同期ギャップ'であり、異なる固有モードが異なる速度で安定化する逆生成過程の時間窓である。
本研究では,結合強度がスペクトルフィルタとして機能し,時間的階層の調整が可能であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion based generative models have achieved unprecedented fidelity in synthesizing high dimensional data, yet the theoretical mechanisms governing multimodal generation remain poorly understood. Here, we present a theoretical framework for coupled diffusion models, using coupled Ornstein-Uhlenbeck processes as a tractable model. By using the nonequilibrium statistical physics of dynamical phase transitions, we demonstrate that multimodal generation is governed by a spectral hierarchy of interaction timescales rather than simultaneous resolution. A key prediction is the ``synchronization gap'', a temporal window during the reverse generative process where distinct eigenmodes stabilize at different rates, providing a theoretical explanation for common desynchronization artifacts. We derive analytical conditions for speciation and collapse times under both symmetric and anisotropic coupling regimes, establishing strict bounds for coupling strength to avoid unstable symmetry breaking. We show that the coupling strength acts as a spectral filter that enforces a tunable temporal hierarchy on generation. We support these predictions through controlled experiments with diffusion models trained on MNIST datasets and exact score samplers. These results motivate time dependent coupling schedules that target mode specific timescales, offering a potential alternative to ad hoc guidance tuning.
- Abstract(参考訳): 拡散に基づく生成モデルは高次元データの合成において前例のない忠実性を達成したが、マルチモーダル生成を規定する理論的メカニズムはいまだ理解されていない。
本稿では,Ornstein-Uhlenbeck過程をトラクタブルモデルとして用いた,結合拡散モデルの理論的枠組みを提案する。
動的相転移の非平衡統計物理学を用いて、マルチモーダル生成は同時分解ではなく相互作用の時間スケールのスペクトル階層によって制御されることを示した。
重要な予測は '`synchronization gap' であり、これは逆生成過程における時間的窓であり、異なる固有モードが異なる速度で安定化し、共通の非同期化アーティファクトの理論的な説明を提供する。
対称および異方性結合状態下での偏差と崩壊時間の解析条件を導出し、不安定な対称性の破れを避けるために結合強度の厳密な境界を確立する。
本研究では,結合強度がスペクトルフィルタとして機能し,時間的階層の調整が可能であることを示す。
MNISTデータセットと正確なスコアサンプリングを用いた拡散モデルを用いた制御実験により,これらの予測を支援する。
これらの結果は、特定の時間スケールをターゲットにした時間依存結合スケジュールを動機付け、アドホックガイダンスチューニングに代わる潜在的な選択肢を提供する。
関連論文リスト
- Weighted Stochastic Differential Equation to Implement Wasserstein-Fisher-Rao Gradient Flow [0.0]
有望な作業のラインは、情報幾何学から、大量再重み付け機構を備えた拡散に基づくサンプル装置の拡張まで、ツールを活用する。
本研究は,WFRに基づくサンプリング力学の予備的かつ厳密な研究であり,今後の発展の基礎となる理論構造を明らかにすることを目的としている。
論文 参考訳(メタデータ) (2025-12-19T18:31:27Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - TIMED: Adversarial and Autoregressive Refinement of Diffusion-Based Time Series Generation [0.31498833540989407]
TIMEDは、フォワード-リバース拡散プロセスを通じてグローバル構造をキャプチャする統合生成フレームワークである。
特徴空間における実および合成分布をさらに整合させるため、TIMEDは最大平均離散性(MMD)損失を取り入れている。
我々は、TIMEDが最先端の生成モデルよりも現実的で時間的に一貫性のあるシーケンスを生成することを示す。
論文 参考訳(メタデータ) (2025-09-23T23:05:40Z) - Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning [79.65014491424151]
量子離散化拡散確率モデル(QD3PM)を提案する。
これは、指数関数的に大きなヒルベルト空間における拡散と denoising を通じて合同確率学習を可能にする。
本稿では,共同分布学習における量子的優位性を生かして,生成モデルの新たな理論的パラダイムを確立する。
論文 参考訳(メタデータ) (2025-05-08T11:48:21Z) - Generative Latent Neural PDE Solver using Flow Matching [8.397730500554047]
低次元の潜伏空間にPDE状態を埋め込んだPDEシミュレーションのための潜伏拡散モデルを提案する。
我々のフレームワークは、オートエンコーダを使用して、異なるタイプのメッシュを統一された構造化潜在グリッドにマッピングし、複雑なジオメトリをキャプチャします。
数値実験により,提案モデルは,精度と長期安定性の両方において,決定論的ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-03-28T16:44:28Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間列を表現するために設計された新しい深部力学モデルを提案する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
振動系, ビデオ, 実世界の状態系列(MuJoCo)の実験結果から, 学習可能なエネルギーベース先行モデルの方が既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-09-05T18:14:22Z) - Dynamical Regimes of Diffusion Models [14.797301819675454]
空間の次元とデータ数が大きい体制における生成拡散モデルについて検討する。
本研究は, 逆向き発生拡散過程における3つの異なる動的状態を明らかにするものである。
崩壊時間の次元とデータ数への依存性は、拡散モデルにおける次元の呪いの徹底的な評価を与える。
論文 参考訳(メタデータ) (2024-02-28T17:19:26Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - Dual reparametrized Variational Generative Model for Time-Series
Forecasting [0.0]
本稿では,変分オートエンコーダ(VAE)の2つの再パラメータ化変分機構を導入し,解析的性能を実証する。
DualVDTは、新しい二重再パラメータ構造を持ち、分析的にも実験的にも高度な性能を持つ。
論文 参考訳(メタデータ) (2022-03-11T06:02:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。