論文の概要: IRG: Generating Synthetic Relational Databases using GANs
- arxiv url: http://arxiv.org/abs/2312.15187v1
- Date: Sat, 23 Dec 2023 07:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:10:15.285412
- Title: IRG: Generating Synthetic Relational Databases using GANs
- Title(参考訳): IRG:GANを用いた合成関係データベースの生成
- Authors: Jiayu Li and Y.C. Tay
- Abstract要約: アカデミックや業界ではデータ共有の需要が急増している。
1つの選択肢は、実際のデータの合成生成されたバージョンのみを共有することである。
本稿では、GAN(Generative Adrial Network)を用いてテーブルを合成生成するインクリメンタルジェネレータ(IRG)を提案する。
- 参考スコア(独自算出の注目度): 5.082764587927857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is an overgrowing demand for data sharing in academia and industry.
However, such sharing has issues with personal privacy and data
confidentiality. One option is to share only synthetically-generated versions
of the real data. Generative Adversarial Network (GAN) is a recently-popular
technique that can be used for this purpose.
Relational databases usually have multiple tables that are related to each
other. So far, the use of GANs has essentially focused on generating single
tables. This paper presents Incremental Relational Generator (IRG), which uses
GANs to synthetically generate interrelated tables. Given an empirical
relational database, IRG can generate a synthetic version that can be safely
shared.
IRG generates the tables in some sequential order. The key idea is to
construct a context, based on the tables generated so far, when using a GAN to
generate the next table. Experiments with public datasets and private student
data show that IRG outperforms state-of-the-art in terms of statistical
properties and query results.
- Abstract(参考訳): アカデミックや業界ではデータ共有の需要が急増している。
しかし、このような共有は個人のプライバシーやデータの機密性に問題がある。
ひとつの選択肢は、合成生成された実データのみを共有することだ。
generative adversarial network (gan)は、この目的のために使用できる最近人気の高い技術である。
関係データベースは通常、互いに関連する複数のテーブルを持つ。
これまでのところ、GANの使用は基本的に単一のテーブルの生成に重点を置いています。
本稿では、GANを用いて相互関係テーブルを合成するインクリメンタルリレーショナルリレーショナルジェネレータ(IRG)を提案する。
経験的リレーショナルデータベースが与えられた場合、IRGは安全に共有できる合成バージョンを生成することができる。
IRGは連続した順序でテーブルを生成する。
キーとなるアイデアは、GANを使用して次のテーブルを生成する際に、これまで生成されたテーブルに基づいてコンテキストを構築することです。
公開データセットと私立学生データによる実験では、IRGは統計特性とクエリ結果の点で最先端の成績を示している。
関連論文リスト
- Adapting Differentially Private Synthetic Data to Relational Databases [9.532509662034062]
我々は、既存の差分秘密(DP)合成データ生成機構と組み合わせることができる、第一種アルゴリズムを導入する。
我々のアルゴリズムは、個々の合成テーブル間の関係を反復的に洗練し、近似誤差を最小化する。
論文 参考訳(メタデータ) (2024-05-29T00:25:07Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-04T16:54:40Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Importance of Synthesizing High-quality Data for Text-to-SQL Parsing [71.02856634369174]
最先端のテキストから重み付けアルゴリズムは、強化された合成データでトレーニングされた場合、一般的なベンチマークでは改善されなかった。
本稿では,スキーマから重要な関係を取り入れ,強い型付けを課し,スキーマ重み付きカラムサンプリングを行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-17T02:53:21Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - Row Conditional-TGAN for generating synthetic relational databases [0.0]
本稿ではRow-Tabular Generative Adversarial Network (RC-TGAN)を提案する。
RC-TGANは、子テーブルのGANの設計に親行の条件データを組み込むことで、テーブル間の関係情報をモデル化する。
論文 参考訳(メタデータ) (2022-11-14T18:14:18Z) - Generative Adversarial Networks for Synthetic Data Generation: A
Comparative Study [1.0896567381206714]
データ合成の手段としてGAN(Generative Adversarial Networks)が注目されている。
本稿では,合成国勢調査マイクロデータの生成を目的としたGANの活用の可能性について考察する。
論文 参考訳(メタデータ) (2021-12-03T14:23:17Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Brainstorming Generative Adversarial Networks (BGANs): Towards
Multi-Agent Generative Models with Distributed Private Datasets [70.62568022925971]
生成的敵ネットワーク(GAN)は、データ空間を適切に表現する大規模なデータセットによって供給されなければならない。
多くのシナリオでは、利用可能なデータセットは制限され、複数のエージェントに分散する可能性がある。
本稿では,BGAN(Breepstorming GAN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-02T02:58:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。