論文の概要: IRG: Generating Synthetic Relational Databases using GANs
- arxiv url: http://arxiv.org/abs/2312.15187v1
- Date: Sat, 23 Dec 2023 07:47:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:10:15.285412
- Title: IRG: Generating Synthetic Relational Databases using GANs
- Title(参考訳): IRG:GANを用いた合成関係データベースの生成
- Authors: Jiayu Li and Y.C. Tay
- Abstract要約: アカデミックや業界ではデータ共有の需要が急増している。
1つの選択肢は、実際のデータの合成生成されたバージョンのみを共有することである。
本稿では、GAN(Generative Adrial Network)を用いてテーブルを合成生成するインクリメンタルジェネレータ(IRG)を提案する。
- 参考スコア(独自算出の注目度): 5.082764587927857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is an overgrowing demand for data sharing in academia and industry.
However, such sharing has issues with personal privacy and data
confidentiality. One option is to share only synthetically-generated versions
of the real data. Generative Adversarial Network (GAN) is a recently-popular
technique that can be used for this purpose.
Relational databases usually have multiple tables that are related to each
other. So far, the use of GANs has essentially focused on generating single
tables. This paper presents Incremental Relational Generator (IRG), which uses
GANs to synthetically generate interrelated tables. Given an empirical
relational database, IRG can generate a synthetic version that can be safely
shared.
IRG generates the tables in some sequential order. The key idea is to
construct a context, based on the tables generated so far, when using a GAN to
generate the next table. Experiments with public datasets and private student
data show that IRG outperforms state-of-the-art in terms of statistical
properties and query results.
- Abstract(参考訳): アカデミックや業界ではデータ共有の需要が急増している。
しかし、このような共有は個人のプライバシーやデータの機密性に問題がある。
ひとつの選択肢は、合成生成された実データのみを共有することだ。
generative adversarial network (gan)は、この目的のために使用できる最近人気の高い技術である。
関係データベースは通常、互いに関連する複数のテーブルを持つ。
これまでのところ、GANの使用は基本的に単一のテーブルの生成に重点を置いています。
本稿では、GANを用いて相互関係テーブルを合成するインクリメンタルリレーショナルリレーショナルジェネレータ(IRG)を提案する。
経験的リレーショナルデータベースが与えられた場合、IRGは安全に共有できる合成バージョンを生成することができる。
IRGは連続した順序でテーブルを生成する。
キーとなるアイデアは、GANを使用して次のテーブルを生成する際に、これまで生成されたテーブルに基づいてコンテキストを構築することです。
公開データセットと私立学生データによる実験では、IRGは統計特性とクエリ結果の点で最先端の成績を示している。
関連論文リスト
- RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
本稿では,リレーショナルデータベースの特徴を捉えた新しいGNNフレームワークであるRelGNNを紹介する。
我々のアプローチの核となるのは、高次三部構造を形成するノードの列である原子経路の導入である。
RelGNNは、最先端の精度を最大25%改善して一貫して達成している。
論文 参考訳(メタデータ) (2025-02-10T18:58:40Z) - Towards Privacy-Preserving Relational Data Synthesis via Probabilistic Relational Models [3.877001015064152]
確率的リレーショナルモデルは、一階述語論理と確率的モデルを組み合わせるための確立された形式主義を提供する。
人工知能の分野は、さまざまな機械学習タスクのために、ますます大量のリレーショナルトレーニングデータを必要とする。
プライバシの懸念やデータ保護の規制、高コストなどにより、現実のデータの収集は難しいことが多い。
論文 参考訳(メタデータ) (2024-09-06T11:24:25Z) - RelBench: A Benchmark for Deep Learning on Relational Databases [78.52438155603781]
本稿では,グラフニューラルネットワークを用いたデータベース上でタスクを解くための公開ベンチマークであるRelBenchを紹介する。
私たちはRelBenchを使って、ディープラーニングインフラストラクチャに関する初の総合的な研究を行っています。
RDLは、人間の作業量を1桁以上削減しながら、より良く学習する。
論文 参考訳(メタデータ) (2024-07-29T14:46:13Z) - Differentially Private Synthetic Data Generation for Relational Databases [9.532509662034062]
我々は、既存の差分秘密(DP)合成データ生成機構と組み合わせることができる、第一種アルゴリズムを導入する。
我々のアルゴリズムは、個々の合成テーブル間の関係を反復的に洗練し、近似誤差を最小化する。
論文 参考訳(メタデータ) (2024-05-29T00:25:07Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-04T16:54:40Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - Federated Learning with GAN-based Data Synthesis for Non-IID Clients [8.304185807036783]
フェデレートラーニング(FL)は、最近、プライバシ保護のためのコラボレーティブラーニングパラダイムとして人気を博している。
我々は,合成データを共有することで,この非IID課題を解決するために,SDA-FL(Synthetic Data Aided Federated Learning)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-11T11:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。