論文の概要: Exponential Family Variational Flow Matching for Tabular Data Generation
- arxiv url: http://arxiv.org/abs/2506.05940v1
- Date: Fri, 06 Jun 2025 10:07:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.416886
- Title: Exponential Family Variational Flow Matching for Tabular Data Generation
- Title(参考訳): 語彙データ生成のための指数家族変動流マッチング
- Authors: Andrés Guzmán-Cordero, Floor Eijkelboom, Jan-Willem van de Meent,
- Abstract要約: 本研究では,表データ生成のための変分フローマッチング(VFM)手法であるTabbyFlowを開発した。
異種データ型を表すEF-VFM(Exponential Family Variational Flow Matching)を提案する。
また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
- 参考スコア(独自算出の注目度): 5.262772849580666
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While denoising diffusion and flow matching have driven major advances in generative modeling, their application to tabular data remains limited, despite its ubiquity in real-world applications. To this end, we develop TabbyFlow, a variational Flow Matching (VFM) method for tabular data generation. To apply VFM to data with mixed continuous and discrete features, we introduce Exponential Family Variational Flow Matching (EF-VFM), which represents heterogeneous data types using a general exponential family distribution. We hereby obtain an efficient, data-driven objective based on moment matching, enabling principled learning of probability paths over mixed continuous and discrete variables. We also establish a connection between variational flow matching and generalized flow matching objectives based on Bregman divergences. Evaluation on tabular data benchmarks demonstrates state-of-the-art performance compared to baselines.
- Abstract(参考訳): 拡散と流れの整合性は生成モデリングにおいて大きな進歩を導いてきたが、実際の応用においてその有用性にもかかわらず、表型データへの応用は限定的のままである。
そこで我々は,表データ生成のための変動フローマッチング(VFM)手法であるTabbyFlowを開発した。
連続した特徴と離散的な特徴を混合したデータにVFMを適用するために,指数関数分布を用いた不均一なデータ型を表す指数族変動フローマッチング(EF-VFM)を導入する。
そこで我々は、モーメントマッチングに基づく効率的でデータ駆動的な目的を達成し、連続変数と離散変数を混合した確率経路の原理的学習を可能にする。
また,Bregmanの発散に基づく変動流整合と一般化流整合の関連性を確立する。
表形式のデータベンチマークの評価は、ベースラインと比較して最先端のパフォーマンスを示している。
関連論文リスト
- TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Training Normalizing Flows from Dependent Data [31.42053454078623]
データポイント間の依存関係を取り入れたフローの正規化の可能性が示唆された。
本研究では, 観測データ間の依存関係の尊重が, 合成データと実世界のデータの両方に対する経験的結果を改善することを示す。
論文 参考訳(メタデータ) (2022-09-29T16:50:34Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z) - Learning Likelihoods with Conditional Normalizing Flows [54.60456010771409]
条件正規化フロー(CNF)はサンプリングと推論において効率的である。
出力空間写像に対する基底密度が入力 x 上で条件づけられた CNF について、条件密度 p(y|x) をモデル化する。
論文 参考訳(メタデータ) (2019-11-29T19:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。