論文の概要: Composable Generative Models
- arxiv url: http://arxiv.org/abs/2102.09249v1
- Date: Thu, 18 Feb 2021 10:11:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:17:42.237365
- Title: Composable Generative Models
- Title(参考訳): 構成可能なジェネラティブモデル
- Authors: Johan Leduc and Nicolas Grislain
- Abstract要約: 本稿では,プライバシ保護アプリケーションを考慮した合成データ生成モデルについて述べる。
新しいアーキテクチャであるComposable Generative Model(CGM)を導入する。
CGMは13のデータセットで評価され、14の最近の生成モデルと比較された。
- 参考スコア(独自算出の注目度): 5.990174495635326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative modeling has recently seen many exciting developments with the
advent of deep generative architectures such as Variational Auto-Encoders (VAE)
or Generative Adversarial Networks (GAN). The ability to draw synthetic i.i.d.
observations with the same joint probability distribution as a given dataset
has a wide range of applications including representation learning, compression
or imputation. It appears that it also has many applications in privacy
preserving data analysis, especially when used in conjunction with differential
privacy techniques. This paper focuses on synthetic data generation models with
privacy preserving applications in mind. It introduces a novel architecture,
the Composable Generative Model (CGM) that is state-of-the-art in tabular data
generation. Any conditional generative model can be used as a sub-component of
the CGM, including CGMs themselves, allowing the generation of numerical,
categorical data as well as images, text, or time series. The CGM has been
evaluated on 13 datasets (6 standard datasets and 7 simulated) and compared to
14 recent generative models. It beats the state of the art in tabular data
generation by a significant margin.
- Abstract(参考訳): 生成モデリングは最近、変分オートエンコーダ(VAE)やGAN(Generative Adversarial Networks)といった深層生成アーキテクチャの出現によって、多くのエキサイティングな発展を遂げている。
合成i.i.d.を描ける能力
与えられたデータセットと同じ結合確率分布を持つ観測は、表現学習、圧縮または計算を含む幅広い応用を有する。
また、特に差分プライバシー技術と組み合わせて使用する場合、プライバシー保護データ分析にも多くの応用があるようだ。
本稿では,プライバシ保護アプリケーションを考慮した合成データ生成モデルについて述べる。
テーブルデータ生成における最先端の技術である、新しいアーキテクチャであるcomposable generative model(cgm)を紹介している。
任意の条件生成モデルは、CGM自体を含むCGMのサブコンポーネントとして使用することができ、数値、カテゴリデータ、画像、テキスト、または時系列の生成を可能にする。
CGMは13のデータセット(6つの標準データセットと7のシミュレーション)で評価され、14の最近の生成モデルと比較されている。
グラフデータ生成における最先端の技術を、かなりのマージンで打ち負かしている。
関連論文リスト
- Generating Realistic Tabular Data with Large Language Models [49.03536886067729]
大規模言語モデル(LLM)は多様なタスクに使われてきたが、特徴と対象変数の正確な相関は捉えていない。
そこで本研究では,LLMに基づく3つの重要な改良を加えて,実データの特徴クラス相関を正しく把握する手法を提案する。
実験の結果,本手法は下流タスクにおいて,20個のデータセット上で10個のSOTAベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-10-29T04:14:32Z) - An improved tabular data generator with VAE-GMM integration [9.4491536689161]
本稿では,現在のアプローチの限界に対処する新しい変分オートエンコーダ(VAE)モデルを提案する。
本手法は,TVAEモデルにインスパイアされたベイジアン・ガウス混合モデル(BGM)をVAEアーキテクチャに組み込む。
我々は,2つの医療関連データセットを含む混合データ型を持つ実世界の3つのデータセットに対して,我々のモデルを徹底的に検証する。
論文 参考訳(メタデータ) (2024-04-12T12:31:06Z) - A Review of Modern Recommender Systems Using Generative Models (Gen-RecSys) [57.30228361181045]
この調査は、ジェネレーティブモデル(Gen-RecSys)を用いたレコメンデーションシステムにおける重要な進歩を結びつける。
対話駆動生成モデル、自然言語レコメンデーションのための大規模言語モデル(LLM)とテキストデータの使用、RSにおける画像やビデオの生成と処理のためのマルチモーダルモデルの統合。
我々の研究は、Gen-RecSysの影響と害を評価するために必要なパラダイムを強調し、オープンな課題を特定します。
論文 参考訳(メタデータ) (2024-03-31T06:57:57Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Language Models are Realistic Tabular Data Generators [15.851912974874116]
本稿では,GReaT (Generation of Realistic Tabular data) を提案する。
提案手法の有効性を,複数角度から得られたデータサンプルの有効性と品質を定量化する一連の実験で実証した。
論文 参考訳(メタデータ) (2022-10-12T15:03:28Z) - TTS-CGAN: A Transformer Time-Series Conditional GAN for Biosignal Data
Augmentation [5.607676459156789]
我々は,既存のマルチクラスデータセットに基づいて学習し,クラス固有の合成時系列列を生成する条件付きGANモデルであるTS-CGANを提案する。
我々のモデルによって生成された合成シーケンスは、実データとは区別できないため、同じタイプの実信号の補完や置換に使うことができる。
論文 参考訳(メタデータ) (2022-06-28T01:01:34Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - DATGAN: Integrating expert knowledge into deep learning for synthetic
tabular data [0.0]
合成データは、バイアスデータセットの修正や、シミュレーション目的の不足したオリジナルデータの置換など、さまざまなアプリケーションで使用することができる。
ディープラーニングモデルはデータ駆動であり、生成プロセスを制御するのは難しい。
本稿では、これらの制限に対処するため、DATGAN(Directed Acyclic Tabular GAN)を提案する。
論文 参考訳(メタデータ) (2022-03-07T16:09:03Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Differentially Private Synthetic Medical Data Generation using
Convolutional GANs [7.2372051099165065]
R'enyiの差分プライバシーを用いた合成データ生成のための差分プライベートフレームワークを開発する。
提案手法は, 畳み込み自己エンコーダと畳み込み生成対向ネットワークを利用して, 生成した合成データの重要な特性をある程度保存する。
私たちのモデルは、同じプライバシー予算の下で既存の最新モデルを上回ることを実証します。
論文 参考訳(メタデータ) (2020-12-22T01:03:49Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。