論文の概要: Beyond Linear Diffusions: Improved Representations for Rare Conditional Generative Modeling
- arxiv url: http://arxiv.org/abs/2510.02499v1
- Date: Thu, 02 Oct 2025 19:06:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.142146
- Title: Beyond Linear Diffusions: Improved Representations for Rare Conditional Generative Modeling
- Title(参考訳): 線形拡散を超えて:希少条件生成モデリングのための表現の改善
- Authors: Kulunu Dharmakeerthi, Yousef El-Laham, Henry H. Wong, Vamsi K. Potluru, Changhong He, Taosong He,
- Abstract要約: 条件空間の低確率領域において、スコアベース生成モデル学習のサンプル複雑さが小さくなるように、データ表現とフォワードスキームを適応させることが可能であることを示す。
非線形ドリフト項のデータ駆動的選択による拡散が,データの適切な表現の下での尾イベントのモデル化に最も適していることを示す。
- 参考スコア(独自算出の注目度): 4.527435625329663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have emerged as powerful generative frameworks with widespread applications across machine learning and artificial intelligence systems. While current research has predominantly focused on linear diffusions, these approaches can face significant challenges when modeling a conditional distribution, $P(Y|X=x)$, when $P(X=x)$ is small. In these regions, few samples, if any, are available for training, thus modeling the corresponding conditional density may be difficult. Recognizing this, we show it is possible to adapt the data representation and forward scheme so that the sample complexity of learning a score-based generative model is small in low probability regions of the conditioning space. Drawing inspiration from conditional extreme value theory we characterize this method precisely in the special case in the tail regions of the conditioning variable, $X$. We show how diffusion with a data-driven choice of nonlinear drift term is best suited to model tail events under an appropriate representation of the data. Through empirical validation on two synthetic datasets and a real-world financial dataset, we demonstrate that our tail-adaptive approach significantly outperforms standard diffusion models in accurately capturing response distributions at the extreme tail conditions.
- Abstract(参考訳): 拡散モデルは、機械学習や人工知能システムにまたがって広く応用される強力な生成フレームワークとして登場した。
現在の研究は主に線形拡散に焦点が当てられているが、これらの手法は条件分布をモデル化する際には、$P(Y|X=x)$、$P(X=x)$が小さい場合には、大きな課題に直面することがある。
これらの領域では、トレーニングに利用できるサンプルが少ないため、対応する条件密度をモデル化することは困難である。
これを認識し、条件空間の低確率領域において、スコアベースの生成モデルを学ぶ際のサンプルの複雑さが小さくなるように、データ表現とフォワードスキームを適応させることが可能であることを示す。
条件付き極値理論からインスピレーションを得て、条件付き変数の尾領域の特別な場合、$X$を正確に特徴付ける。
非線形ドリフト項のデータ駆動的選択による拡散が,データの適切な表現の下での尾イベントのモデル化に最も適していることを示す。
2つの合成データセットと実世界の財務データセットに対する実証的検証を通じて、我々のテール適応アプローチは、極端尾条件での応答分布を正確に把握する上で、標準拡散モデルを大幅に上回っていることを示す。
関連論文リスト
- DS-Diffusion: Data Style-Guided Diffusion Model for Time-Series Generation [3.7098771725459336]
時系列生成タスクのためのデータスタイル誘導拡散モデル(DS-Diffusion)を提案する。
DS-Diffusionは、条件付きガイダンスを導入するためにフレームワーク全体をトレーニングするのを避ける。
生成されたサンプルは、それらが発するデータスタイルを明確に示すことができる。
論文 参考訳(メタデータ) (2025-09-23T03:06:39Z) - Efficient Flow Matching using Latent Variables [9.363347684114474]
我々は、texttLatent-CFM$は、最先端のフローマッチングモデルよりも、トレーニングや計算が大幅に少ないため、生成品質が向上していることを示す。
また、物理過程から生じる空間場の生成的モデリングについても検討する。
論文 参考訳(メタデータ) (2025-05-07T14:59:23Z) - Bayesian Flow Is All You Need to Sample Out-of-Distribution Chemical Spaces [0.0]
ベイジアンフローネットワークは,高品質なアウト・オブ・ディストリビューション・サンプルを生成することができることを示す。
本研究では,半自己回帰型トレーニング/サンプリング手法を導入し,モデル性能の向上と最先端モデルの超越を支援する。
論文 参考訳(メタデータ) (2024-12-16T04:43:54Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - Constrained Diffusion Models via Dual Training [80.03953599062365]
拡散プロセスは、トレーニングデータセットのバイアスを反映したサンプルを生成する傾向がある。
所望の分布に基づいて拡散制約を付与し,制約付き拡散モデルを構築する。
本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文 参考訳(メタデータ) (2024-08-27T14:25:42Z) - Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory [87.00653989457834]
条件付き拡散モデルは現代の画像合成の基礎となり、計算生物学や強化学習などの分野に広く応用されている。
経験的成功にもかかわらず、条件拡散モデルの理論はほとんど欠落している。
本稿では,条件拡散モデルを用いた分布推定の急激な統計的理論を提示することにより,ギャップを埋める。
論文 参考訳(メタデータ) (2024-03-18T17:08:24Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution [67.9215891673174]
離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文 参考訳(メタデータ) (2023-10-25T17:59:12Z) - User-defined Event Sampling and Uncertainty Quantification in Diffusion
Models for Physical Dynamical Systems [49.75149094527068]
拡散モデルを用いて予測を行い,カオス力学系に対する不確かさの定量化が可能であることを示す。
本研究では,雑音レベルが低下するにつれて真の分布に収束する条件付きスコア関数の確率的近似法を開発する。
推論時に非線形ユーザ定義イベントを条件付きでサンプリングすることができ、分布の尾部からサンプリングした場合でもデータ統計と一致させることができる。
論文 参考訳(メタデータ) (2023-06-13T03:42:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。