論文の概要: Bayesian Generative Adversarial Networks via Gaussian Approximation for Tabular Data Synthesis
- arxiv url: http://arxiv.org/abs/2602.21948v1
- Date: Wed, 25 Feb 2026 14:32:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.861411
- Title: Bayesian Generative Adversarial Networks via Gaussian Approximation for Tabular Data Synthesis
- Title(参考訳): 語彙データ合成のためのガウス近似によるベイズ生成逆数ネットワーク
- Authors: Bahrul Ilmi Nasution, Mark Elliot, Richard Allmendinger,
- Abstract要約: 条件付き表型GAN(CTGAN)は最も一般的な変種であるが、リスクユーティリティのトレードオフを効果的にナビゲートするのに苦労している。
我々は,CTGAN ジェネレータ内における SWAG (Weight Averaging-Gaussian) を用いた後部近似手法を提案する。
我々は,GACTGANがCTGANよりも優れた合成データを得ることを示した。
- 参考スコア(独自算出の注目度): 1.6782015131510801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Adversarial Networks (GAN) have been used in many studies to synthesise mixed tabular data. Conditional tabular GAN (CTGAN) have been the most popular variant but struggle to effectively navigate the risk-utility trade-off. Bayesian GAN have received less attention for tabular data, but have been explored with unstructured data such as images and text. The most used technique employed in Bayesian GAN is Markov Chain Monte Carlo (MCMC), but it is computationally intensive, particularly in terms of weight storage. In this paper, we introduce Gaussian Approximation of CTGAN (GACTGAN), an integration of the Bayesian posterior approximation technique using Stochastic Weight Averaging-Gaussian (SWAG) within the CTGAN generator to synthesise tabular data, reducing computational overhead after the training phase. We demonstrate that GACTGAN yields better synthetic data compared to CTGAN, achieving better preservation of tabular structure and inferential statistics with less privacy risk. These results highlight GACTGAN as a simpler, effective implementation of Bayesian tabular synthesis.
- Abstract(参考訳): 複合表データの合成にはGAN(Generative Adversarial Networks)が用いられている。
条件付き表型GAN(CTGAN)は最も一般的な変種であるが、リスクユーティリティのトレードオフを効果的にナビゲートするのに苦労している。
ベイジアン GAN は表形式のデータに対してあまり注目されていないが、画像やテキストなどの構造化されていないデータを用いて探索されてきた。
最も使われている手法はマルコフ・チェイン・モンテカルロ (MCMC) であるが、特に重量保存の点で計算集約的である。
本稿では,CTGANジェネレータ内でのStochastic Weight Averaging-Gaussian (SWAG) を用いたベイズ的後方近似手法を統合したGaussian Approximation of CTGAN (GACTGAN)を提案する。
我々は,GACTGANがCTGANよりも優れた合成データを得ることを示した。
これらの結果は、GACTGANがベイズ表合成のよりシンプルで効果的な実装であることを強調している。
関連論文リスト
- Mitra: Mixed Synthetic Priors for Enhancing Tabular Foundation Models [85.64873567417396]
実世界のデータに対して,その多様性,特異性,および性能のために選択された合成前駆体の硬化した混合物をトレーニングしたTFMであるMitraを紹介する。
Mitraは、TabPFNv2やTabICLのような最先端のTFMを、分類と回帰のベンチマークで一貫して上回っている。
論文 参考訳(メタデータ) (2025-10-24T07:15:06Z) - Multi-objective evolutionary GAN for tabular data synthesis [0.873811641236639]
合成データは統計機関や他の統計データ生成装置によるデータ共有において重要な役割を果たしている。
本稿では,SMOE-CTGAN(SMOE-CTGAN)を合成データとして提案する。
以上の結果から,SMOE-CTGANは,複数の国勢調査データセットに対して,異なるリスクと実用レベルを持つ合成データセットを発見可能であることが示唆された。
論文 参考訳(メタデータ) (2024-04-15T23:07:57Z) - SMaRt: Improving GANs with Score Matching Regularity [114.43433222721025]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることがわかった。
提案手法は, 実世界のデータセットにおいて, 近似スコア関数として機能する事前学習拡散モデルを用いて, 最先端のGANの性能を継続的に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - MargCTGAN: A "Marginally'' Better CTGAN for the Low Sample Regime [63.851085173614]
MargCTGANは、非相関な辺縁部の特徴マッチングを追加し、結果として、下流ユーティリティと合成データの統計的性質が一貫した改善をもたらす。
論文 参考訳(メタデータ) (2023-07-16T10:28:49Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - ciDATGAN: Conditional Inputs for Tabular GANs [0.0]
合成画像を生成するためのGAN(Generative Adversarial Networks)のコアコンポーネントとなっている。
条件付き入力の追加は、前者と比較してモデルの性能を損なうことを示す。
我々は、ciDATGANが、よく調和した条件入力の助けを借りてデータセットのアンバイアス化に利用できることを示した。
論文 参考訳(メタデータ) (2022-10-05T17:22:54Z) - CTAB-GAN+: Enhancing Tabular Data Synthesis [11.813626861559904]
CTAB-GAN+は、高機能な合成データドメインのための条件付きGANに下流損失を追加することにより、最先端のGANを改善する。
CTAB-GAN+は、複数のデータセットと異なるプライバシー予算下での学習タスクに対して、少なくとも48.16%高いユーティリティで、プライバシ保存データを合成する。
論文 参考訳(メタデータ) (2022-04-01T12:52:30Z) - An Evaluation Study of Generative Adversarial Networks for Collaborative
Filtering [75.83628561622287]
本研究は、原論文で発表された結果の再現に成功し、CFGANフレームワークと原評価で使用されるモデルとの相違が与える影響について論じる。
この研究は、CFGANと単純でよく知られた適切に最適化されたベースラインの選択を比較した実験的な分析をさらに拡張し、CFGANは高い計算コストにもかかわらず、それらに対して一貫して競合していないことを観察した。
論文 参考訳(メタデータ) (2022-01-05T20:53:27Z) - OCT-GAN: Neural ODE-based Conditional Tabular GANs [8.062118111791495]
ニューラル常微分方程式(NODE)に基づくジェネレータと判別器を導入する。
我々は、保険詐欺の検出やオンラインニュース記事の予測などを含む13のデータセットを用いて実験を行う。
論文 参考訳(メタデータ) (2021-05-31T13:58:55Z) - CTAB-GAN: Effective Table Data Synthesizing [7.336728307626645]
多様なデータ型をモデル化できる条件付きテーブルGANアーキテクチャCTAB-GANを開発。
CTAB-GANは3種類の変数の実際のデータに非常に似ており、5つの機械学習アルゴリズムの精度が17%向上したことを示しています。
論文 参考訳(メタデータ) (2021-02-16T18:53:57Z) - Improving Generative Adversarial Networks with Local Coordinate Coding [150.24880482480455]
GAN(Generative Adversarial Network)は、事前定義された事前分布から現実的なデータを生成することに成功している。
実際には、意味情報はデータから学んだ潜在的な分布によって表現される。
ローカル座標符号化(LCC)を用いたLCCGANモデルを提案する。
論文 参考訳(メタデータ) (2020-07-28T09:17:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。