論文の概要: ciDATGAN: Conditional Inputs for Tabular GANs
- arxiv url: http://arxiv.org/abs/2210.02404v1
- Date: Wed, 5 Oct 2022 17:22:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:35:16.667186
- Title: ciDATGAN: Conditional Inputs for Tabular GANs
- Title(参考訳): cidatgan: 表型ganの条件入力
- Authors: Gael Lederrey, Tim Hillel, Michel Bierlaire
- Abstract要約: 合成画像を生成するためのGAN(Generative Adversarial Networks)のコアコンポーネントとなっている。
条件付き入力の追加は、前者と比較してモデルの性能を損なうことを示す。
我々は、ciDATGANが、よく調和した条件入力の助けを借りてデータセットのアンバイアス化に利用できることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conditionality has become a core component for Generative Adversarial
Networks (GANs) for generating synthetic images. GANs are usually using latent
conditionality to control the generation process. However, tabular data only
contains manifest variables. Thus, latent conditionality either restricts the
generated data or does not produce sufficiently good results. Therefore, we
propose a new methodology to include conditionality in tabular GANs inspired by
image completion methods. This article presents ciDATGAN, an evolution of the
Directed Acyclic Tabular GAN (DATGAN) that has already been shown to outperform
state-of-the-art tabular GAN models. First, we show that the addition of
conditional inputs does hinder the model's performance compared to its
predecessor. Then, we demonstrate that ciDATGAN can be used to unbias datasets
with the help of well-chosen conditional inputs. Finally, it shows that
ciDATGAN can learn the logic behind the data and, thus, be used to complete
large synthetic datasets using data from a smaller feeder dataset.
- Abstract(参考訳): 合成画像を生成するためのGAN(Generative Adversarial Networks)のコアコンポーネントとなっている。
GANは通常、生成プロセスを制御するために潜伏条件を使います。
しかし、表データにはマニフェスト変数のみが含まれている。
したがって、潜伏条件は生成されたデータを制限するか、十分な良い結果が得られない。
そこで本稿では,画像補完法に触発された表状GANの条件性を含む新しい手法を提案する。
本稿では、現在最先端の表形式GANモデルより優れていることが示されているDATGAN(Directed Acyclic Tabular GAN)の進化であるciDATGANについて述べる。
まず,条件付き入力の追加は,前者と比較してモデルの性能を阻害することを示した。
そこで, ciDATGANは, 適切な条件入力の助けを借りてデータセットのアンバイアス化に利用できることを示す。
最後に、cidatganはデータの背後にあるロジックを学べるので、より小さなフィードデータセットのデータを使って大規模な合成データセットを完成させることができる。
関連論文リスト
- Generating Realistic Tabular Data with Large Language Models [49.03536886067729]
大規模言語モデル(LLM)は多様なタスクに使われてきたが、特徴と対象変数の正確な相関は捉えていない。
そこで本研究では,LLMに基づく3つの重要な改良を加えて,実データの特徴クラス相関を正しく把握する手法を提案する。
実験の結果,本手法は下流タスクにおいて,20個のデータセット上で10個のSOTAベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-29T04:14:32Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Distributed Conditional GAN (discGAN) For Synthetic Healthcare Data
Generation [0.0]
本稿では,医療領域固有の合成データを生成する分散生成適応ネットワーク(discGAN)を提案する。
我々は、オリジナルの2,027 eICUデータセットから249,000の合成記録を生成した。
その結果,disGANは実データに類似した分布を持つデータを生成することができた。
論文 参考訳(メタデータ) (2023-04-09T18:35:05Z) - Language Models are Realistic Tabular Data Generators [15.851912974874116]
本稿では,GReaT (Generation of Realistic Tabular data) を提案する。
提案手法の有効性を,複数角度から得られたデータサンプルの有効性と品質を定量化する一連の実験で実証した。
論文 参考訳(メタデータ) (2022-10-12T15:03:28Z) - DATGAN: Integrating expert knowledge into deep learning for synthetic
tabular data [0.0]
合成データは、バイアスデータセットの修正や、シミュレーション目的の不足したオリジナルデータの置換など、さまざまなアプリケーションで使用することができる。
ディープラーニングモデルはデータ駆動であり、生成プロセスを制御するのは難しい。
本稿では、これらの制限に対処するため、DATGAN(Directed Acyclic Tabular GAN)を提案する。
論文 参考訳(メタデータ) (2022-03-07T16:09:03Z) - Collapse by Conditioning: Training Class-conditional GANs with Limited
Data [109.30895503994687]
非条件学習を活用することにより、観測モード崩壊を効果的に防止する条件付きGAN(cGAN)のトレーニング戦略を提案する。
我々のトレーニング戦略は、無条件のGANから始まり、徐々に条件情報をジェネレータと目的関数に注入する。
安定したトレーニングだけでなく,高品質な画像を生成するために,限られたデータでcGANを訓練する手法を提案する。
論文 参考訳(メタデータ) (2022-01-17T18:59:23Z) - DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative
Networks [71.6879432974126]
本稿では,GANに基づく表型データのための公正な合成データ生成装置であるDECAFを紹介する。
DeCAFは望ましくないバイアスを除去し,高品質な合成データを生成可能であることを示す。
下流モデルの収束と公平性に関する理論的保証を提供する。
論文 参考訳(メタデータ) (2021-10-25T12:39:56Z) - OCT-GAN: Neural ODE-based Conditional Tabular GANs [8.062118111791495]
ニューラル常微分方程式(NODE)に基づくジェネレータと判別器を導入する。
我々は、保険詐欺の検出やオンラインニュース記事の予測などを含む13のデータセットを用いて実験を行う。
論文 参考訳(メタデータ) (2021-05-31T13:58:55Z) - Causal-TGAN: Generating Tabular Data Using Causal Generative Adversarial
Networks [7.232789848964222]
因果モデルCausal Tabular Generative Neural Network (Causal-TGAN) を提案し,合成データを生成する。
シミュレーションデータセットと実データセットの両方の実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2021-04-21T17:59:41Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z) - Inducing Optimal Attribute Representations for Conditional GANs [61.24506213440997]
条件付きGANは、あるカテゴリから別のカテゴリへの画像の変換に広く使用されている。
既存の条件付きGANは、ターゲットドメインラベル情報を0と1の形式でハードコードされたカテゴリベクトルとして符号化する。
本稿では,グラフ畳み込みネットワークを用いた新しいエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T20:24:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。