論文の概要: Composable Generative Models
- arxiv url: http://arxiv.org/abs/2102.09249v1
- Date: Thu, 18 Feb 2021 10:11:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:17:42.237365
- Title: Composable Generative Models
- Title(参考訳): 構成可能なジェネラティブモデル
- Authors: Johan Leduc and Nicolas Grislain
- Abstract要約: 本稿では,プライバシ保護アプリケーションを考慮した合成データ生成モデルについて述べる。
新しいアーキテクチャであるComposable Generative Model(CGM)を導入する。
CGMは13のデータセットで評価され、14の最近の生成モデルと比較された。
- 参考スコア(独自算出の注目度): 5.990174495635326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative modeling has recently seen many exciting developments with the
advent of deep generative architectures such as Variational Auto-Encoders (VAE)
or Generative Adversarial Networks (GAN). The ability to draw synthetic i.i.d.
observations with the same joint probability distribution as a given dataset
has a wide range of applications including representation learning, compression
or imputation. It appears that it also has many applications in privacy
preserving data analysis, especially when used in conjunction with differential
privacy techniques. This paper focuses on synthetic data generation models with
privacy preserving applications in mind. It introduces a novel architecture,
the Composable Generative Model (CGM) that is state-of-the-art in tabular data
generation. Any conditional generative model can be used as a sub-component of
the CGM, including CGMs themselves, allowing the generation of numerical,
categorical data as well as images, text, or time series. The CGM has been
evaluated on 13 datasets (6 standard datasets and 7 simulated) and compared to
14 recent generative models. It beats the state of the art in tabular data
generation by a significant margin.
- Abstract(参考訳): 生成モデリングは最近、変分オートエンコーダ(VAE)やGAN(Generative Adversarial Networks)といった深層生成アーキテクチャの出現によって、多くのエキサイティングな発展を遂げている。
合成i.i.d.を描ける能力
与えられたデータセットと同じ結合確率分布を持つ観測は、表現学習、圧縮または計算を含む幅広い応用を有する。
また、特に差分プライバシー技術と組み合わせて使用する場合、プライバシー保護データ分析にも多くの応用があるようだ。
本稿では,プライバシ保護アプリケーションを考慮した合成データ生成モデルについて述べる。
テーブルデータ生成における最先端の技術である、新しいアーキテクチャであるcomposable generative model(cgm)を紹介している。
任意の条件生成モデルは、CGM自体を含むCGMのサブコンポーネントとして使用することができ、数値、カテゴリデータ、画像、テキスト、または時系列の生成を可能にする。
CGMは13のデータセット(6つの標準データセットと7のシミュレーション)で評価され、14の最近の生成モデルと比較されている。
グラフデータ生成における最先端の技術を、かなりのマージンで打ち負かしている。
関連論文リスト
- Generative Modeling of Regular and Irregular Time Series Data via
Koopman VAEs [53.91784369229405]
モデルの新しい設計に基づく新しい生成フレームワークであるKoopman VAEを紹介する。
クープマン理論に触発され、線形写像を用いて潜在条件事前力学を表現する。
以上の結果から,KVAEは,合成および実世界の時系列生成ベンチマークにおいて,最先端のGAN法およびVAE法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-04T07:14:43Z) - Scaling Laws Do Not Scale [87.76714490248779]
大規模なAIモデルのトレーニングに使用されるデータセットのサイズが大きくなるにつれて、異なるコミュニティの数が増加する可能性がある、と私たちは主張する。
その結果、データセットで表されるコミュニティが、モデルパフォーマンスを評価するために使用されるメトリクスによってキャプチャされない値や嗜好を持つリスクが増大する。
論文 参考訳(メタデータ) (2023-07-05T15:32:21Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time
Series [79.64785804590821]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Language Models are Realistic Tabular Data Generators [15.851912974874116]
本稿では,GReaT (Generation of Realistic Tabular data) を提案する。
提案手法の有効性を,複数角度から得られたデータサンプルの有効性と品質を定量化する一連の実験で実証した。
論文 参考訳(メタデータ) (2022-10-12T15:03:28Z) - TTS-CGAN: A Transformer Time-Series Conditional GAN for Biosignal Data
Augmentation [5.607676459156789]
我々は,既存のマルチクラスデータセットに基づいて学習し,クラス固有の合成時系列列を生成する条件付きGANモデルであるTS-CGANを提案する。
我々のモデルによって生成された合成シーケンスは、実データとは区別できないため、同じタイプの実信号の補完や置換に使うことができる。
論文 参考訳(メタデータ) (2022-06-28T01:01:34Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - DATGAN: Integrating expert knowledge into deep learning for synthetic
tabular data [0.0]
合成データは、バイアスデータセットの修正や、シミュレーション目的の不足したオリジナルデータの置換など、さまざまなアプリケーションで使用することができる。
ディープラーニングモデルはデータ駆動であり、生成プロセスを制御するのは難しい。
本稿では、これらの制限に対処するため、DATGAN(Directed Acyclic Tabular GAN)を提案する。
論文 参考訳(メタデータ) (2022-03-07T16:09:03Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Differentially Private Synthetic Medical Data Generation using
Convolutional GANs [7.2372051099165065]
R'enyiの差分プライバシーを用いた合成データ生成のための差分プライベートフレームワークを開発する。
提案手法は, 畳み込み自己エンコーダと畳み込み生成対向ネットワークを利用して, 生成した合成データの重要な特性をある程度保存する。
私たちのモデルは、同じプライバシー予算の下で既存の最新モデルを上回ることを実証します。
論文 参考訳(メタデータ) (2020-12-22T01:03:49Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。