論文の概要: Generative Adversarial Networks for Synthetic Data Generation: A
Comparative Study
- arxiv url: http://arxiv.org/abs/2112.01925v1
- Date: Fri, 3 Dec 2021 14:23:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 18:51:52.214480
- Title: Generative Adversarial Networks for Synthetic Data Generation: A
Comparative Study
- Title(参考訳): 合成データ生成のための生成的逆ネットワーク--比較研究
- Authors: Claire Little, Mark Elliot, Richard Allmendinger, Sahel Shariati
Samani
- Abstract要約: データ合成の手段としてGAN(Generative Adversarial Networks)が注目されている。
本稿では,合成国勢調査マイクロデータの生成を目的としたGANの活用の可能性について考察する。
- 参考スコア(独自算出の注目度): 1.0896567381206714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Adversarial Networks (GANs) are gaining increasing attention as a
means for synthesising data. So far much of this work has been applied to use
cases outside of the data confidentiality domain with a common application
being the production of artificial images. Here we consider the potential
application of GANs for the purpose of generating synthetic census microdata.
We employ a battery of utility metrics and a disclosure risk metric (the
Targeted Correct Attribution Probability) to compare the data produced by
tabular GANs with those produced using orthodox data synthesis methods.
- Abstract(参考訳): データ合成の手段としてGAN(Generative Adversarial Networks)が注目されている。
これまでのところ、この研究の多くはデータ機密ドメイン以外のユースケースに適用されており、一般的な用途は人工画像の作成である。
本稿では,合成国勢調査マイクロデータの生成を目的としたGANの活用の可能性を検討する。
我々は,表型ganが生成するデータと正統的データ合成法で生成したデータを比較するために,ユーティリティ指標と開示リスク指標(ターゲットの正しい帰属確率)のバッテリを用いる。
関連論文リスト
- Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - CasTGAN: Cascaded Generative Adversarial Network for Realistic Tabular
Data Synthesis [0.4999814847776097]
近年,GAN(Generative Adversarial Network)が注目されている。
合成データの妥当性と基礎となるプライバシーに関する懸念は、十分に対処されていない主要な課題を表している。
論文 参考訳(メタデータ) (2023-07-01T16:52:18Z) - Generative Adversarial Networks for Data Augmentation [0.0]
GANは、データ拡張、画像生成、ドメイン適応など、さまざまなタスクで医療画像解析に利用されてきた。
GANは利用可能なデータセットを増やすために使用できる合成サンプルを生成することができる。
医用画像におけるGANの使用は, 画像が高品質で, 臨床現場での使用に適していることを保証するために, 依然として研究の活発な領域である点に留意する必要がある。
論文 参考訳(メタデータ) (2023-06-03T06:33:33Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Distributed Conditional GAN (discGAN) For Synthetic Healthcare Data
Generation [0.0]
本稿では,医療領域固有の合成データを生成する分散生成適応ネットワーク(discGAN)を提案する。
我々は、オリジナルの2,027 eICUデータセットから249,000の合成記録を生成した。
その結果,disGANは実データに類似した分布を持つデータを生成することができた。
論文 参考訳(メタデータ) (2023-04-09T18:35:05Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - Sequential IoT Data Augmentation using Generative Adversarial Networks [5.8010446129208155]
工業アプリケーションにおけるシーケンシャルデータは、機械学習モデルのトレーニングと評価に使用できる。
代表的なデータの収集は困難で時間がかかるため、小さな根拠からそれを生成するインセンティブがある。
本稿では,IoT(Internet of Things)データを逐次的に拡張するためにGANを使用する可能性について検討する。
論文 参考訳(メタデータ) (2021-01-13T11:08:07Z) - Partially Conditioned Generative Adversarial Networks [75.08725392017698]
Generative Adversarial Networks (GAN)は、実世界のトレーニングデータセットの基盤となる確率分布を暗黙的にモデル化することで、人工データセットを合成する。
条件付きGANとその変種の導入により、これらの手法はデータセット内の各サンプルで利用可能な補助情報に基づいて条件付きサンプルを生成するように拡張された。
本研究では,標準条件付きGANがそのようなタスクに適さないことを論じ,新たなAdversarial Networkアーキテクチャとトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-07-06T15:59:28Z) - Using generative adversarial networks to synthesize artificial financial
datasets [2.376767664163658]
我々は、GANを用いて、研究とベンチマークの目的で、人工財務データを合成することを提案する。
このアプローチを3つのAmerican Expressデータセット上でテストし、適切にトレーニングされたGANがこれらのデータセットを高い忠実度で複製可能であることを示す。
論文 参考訳(メタデータ) (2020-02-06T14:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。