Fugu-MT 論文翻訳(概要): IRG: Generating Synthetic Relational Databases using GANs

論文の概要: IRG: Generating Synthetic Relational Databases using GANs

arxiv url: http://arxiv.org/abs/2312.15187v1
Date: Sat, 23 Dec 2023 07:47:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-27 19:10:15.285412
Title: IRG: Generating Synthetic Relational Databases using GANs
Title（参考訳）: IRG:GANを用いた合成関係データベースの生成
Authors: Jiayu Li and Y.C. Tay
Abstract要約: アカデミックや業界ではデータ共有の需要が急増している。 1つの選択肢は、実際のデータの合成生成されたバージョンのみを共有することである。本稿では、GAN(Generative Adrial Network)を用いてテーブルを合成生成するインクリメンタルジェネレータ(IRG)を提案する。
参考スコア（独自算出の注目度）: 5.082764587927857
License: http://creativecommons.org/licenses/by/4.0/
Abstract: There is an overgrowing demand for data sharing in academia and industry. However, such sharing has issues with personal privacy and data confidentiality. One option is to share only synthetically-generated versions of the real data. Generative Adversarial Network (GAN) is a recently-popular technique that can be used for this purpose. Relational databases usually have multiple tables that are related to each other. So far, the use of GANs has essentially focused on generating single tables. This paper presents Incremental Relational Generator (IRG), which uses GANs to synthetically generate interrelated tables. Given an empirical relational database, IRG can generate a synthetic version that can be safely shared. IRG generates the tables in some sequential order. The key idea is to construct a context, based on the tables generated so far, when using a GAN to generate the next table. Experiments with public datasets and private student data show that IRG outperforms state-of-the-art in terms of statistical properties and query results.
Abstract（参考訳）: アカデミックや業界ではデータ共有の需要が急増している。しかし、このような共有は個人のプライバシーやデータの機密性に問題がある。ひとつの選択肢は、合成生成された実データのみを共有することだ。 generative adversarial network (gan)は、この目的のために使用できる最近人気の高い技術である。関係データベースは通常、互いに関連する複数のテーブルを持つ。これまでのところ、GANの使用は基本的に単一のテーブルの生成に重点を置いています。本稿では、GANを用いて相互関係テーブルを合成するインクリメンタルリレーショナルリレーショナルジェネレータ(IRG)を提案する。経験的リレーショナルデータベースが与えられた場合、IRGは安全に共有できる合成バージョンを生成することができる。 IRGは連続した順序でテーブルを生成する。キーとなるアイデアは、GANを使用して次のテーブルを生成する際に、これまで生成されたテーブルに基づいてコンテキストを構築することです。公開データセットと私立学生データによる実験では、IRGは統計特性とクエリ結果の点で最先端の成績を示している。

関連論文リスト

PluRel: Synthetic Data unlocks Scaling Laws for Relational Foundation Models [51.42043158297229]
マルチタブラルリレーショナルデータベースをスクラッチから合成するフレームワークであるPluelを紹介する。ステップバイステップの方法では,(1)有向グラフのスキーマ,(2)二部グラフのテーブル間一次外部キー接続,(3)条件因果機構によるテーブル内の特徴分布をモデル化する。
論文参考訳（メタデータ） (2026-02-03T21:35:18Z)
Relational Database Distillation: From Structured Tables to Condensed Graph Data [48.347717300340435]
グラフベースモデルに必要な電力を維持しつつ,大規模RDBをコンパクトなヘテロジニアスグラフに蒸留することを目的としている。さらに、擬似ラベルを用いてカーネルリッジ回帰誘導目標を設計し、蒸留グラフの品質特性を創出する。
論文参考訳（メタデータ） (2025-10-08T13:05:31Z)
Synthesize, Retrieve, and Propagate: A Unified Predictive Modeling Framework for Relational Databases [34.57267286892218]
本研究では,一元的依存関係を用いて特徴を合成する一元的予測モデリングフレームワークであるSRPを提案する。 SRPは、リレーショナルデータベース内の一元的および複合的依存関係の両方を完全にキャプチャするように設計されている。
論文参考訳（メタデータ） (2025-08-10T07:59:41Z)
Relational Deep Learning: Challenges, Foundations and Next-Generation Architectures [50.46688111973999]
グラフ機械学習は、任意のグラフ構造化データで学習するモデルの能力を大幅に向上させた。従来の工学的特徴を伴わない'関係エンティティグラフ'のエンドツーエンド表現を可能にする新しい青写真を提案する。本稿では、大規模マルチテーブル統合や、時間力学と異種データのモデリングの複雑さなど、重要な課題について論じる。
論文参考訳（メタデータ） (2025-06-19T23:51:38Z)
RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6013616017646]
RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。 RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文参考訳（メタデータ） (2025-05-31T21:01:02Z)
Boosting Relational Deep Learning with Pretrained Tabular Models [18.34233986830027]
グラフニューラルネットワーク(GNN)は、これらの関係をモデル化することで本質的に魅力的な代替手段を提供する。我々のフレームワークは、GNNと比較して最大33%のパフォーマンス改善と526タイムの推論スピードアップを実現しています。
論文参考訳（メタデータ） (2025-04-07T11:19:04Z)
LLM-TabFlow: Synthetic Tabular Data Generation with Inter-column Logical Relationship Preservation [49.898152180805454]
本研究は,合成表型データ生成におけるカラム間関係の保存について,初めて明示的に検討したものである。 LLM-TabFlowは複雑なカラム間関係と圧縮データをキャプチャする新しい手法であり、Score-based Diffusion を用いて遅延空間における圧縮データの分布をモデル化する。 LLM-TabFlowは、カラム間の関係を完全に保ちながら、データの忠実性、ユーティリティ、プライバシの最良のバランスを保ちながら、すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2025-03-04T00:47:52Z)
RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
本稿では,リレーショナルデータベースの特徴を捉えた新しいGNNフレームワークであるRelGNNを紹介する。我々のアプローチの核となるのは、高次三部構造を形成するノードの列である原子経路の導入である。 RelGNNは、最先端の精度を最大25%改善して一貫して達成している。
論文参考訳（メタデータ） (2025-02-10T18:58:40Z)
RelBench: A Benchmark for Deep Learning on Relational Databases [78.52438155603781]
本稿では,グラフニューラルネットワークを用いたデータベース上でタスクを解くための公開ベンチマークであるRelBenchを紹介する。私たちはRelBenchを使って、ディープラーニングインフラストラクチャに関する初の総合的な研究を行っています。 RDLは、人間の作業量を1桁以上削減しながら、より良く学習する。
論文参考訳（メタデータ） (2024-07-29T14:46:13Z)
Adapting Differentially Private Synthetic Data to Relational Databases [9.532509662034062]
我々は、既存の差分秘密(DP)合成データ生成機構と組み合わせることができる、第一種アルゴリズムを導入する。我々のアルゴリズムは、個々の合成テーブル間の関係を反復的に洗練し、近似誤差を最小化する。
論文参考訳（メタデータ） (2024-05-29T00:25:07Z)
Relational Deep Learning: Graph Representation Learning on Relational Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文参考訳（メタデータ） (2023-12-07T18:51:41Z)
GFS: Graph-based Feature Synthesis for Prediction over Relational Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。 GFSは関係データベースを異種グラフデータベースとして定式化する。 4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文参考訳（メタデータ） (2023-12-04T16:54:40Z)
TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文参考訳（メタデータ） (2023-05-19T10:11:21Z)
Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文参考訳（メタデータ） (2023-04-07T16:38:40Z)
Importance of Synthesizing High-quality Data for Text-to-SQL Parsing [71.02856634369174]
最先端のテキストから重み付けアルゴリズムは、強化された合成データでトレーニングされた場合、一般的なベンチマークでは改善されなかった。本稿では,スキーマから重要な関係を取り入れ,強い型付けを課し,スキーマ重み付きカラムサンプリングを行う新しいフレームワークを提案する。
論文参考訳（メタデータ） (2022-12-17T02:53:21Z)
Generating Realistic Synthetic Relational Data through Graph Variational Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文参考訳（メタデータ） (2022-11-30T10:40:44Z)
Row Conditional-TGAN for generating synthetic relational databases [0.0]
本稿ではRow-Tabular Generative Adversarial Network (RC-TGAN)を提案する。 RC-TGANは、子テーブルのGANの設計に親行の条件データを組み込むことで、テーブル間の関係情報をモデル化する。
論文参考訳（メタデータ） (2022-11-14T18:14:18Z)
Generative Adversarial Networks for Synthetic Data Generation: A Comparative Study [1.0896567381206714]
データ合成の手段としてGAN(Generative Adversarial Networks)が注目されている。本稿では,合成国勢調査マイクロデータの生成を目的としたGANの活用の可能性について考察する。
論文参考訳（メタデータ） (2021-12-03T14:23:17Z)
Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。 PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。 GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文参考訳（メタデータ） (2021-04-12T21:24:02Z)
Brainstorming Generative Adversarial Networks (BGANs): Towards Multi-Agent Generative Models with Distributed Private Datasets [70.62568022925971]
生成的敵ネットワーク(GAN)は、データ空間を適切に表現する大規模なデータセットによって供給されなければならない。多くのシナリオでは、利用可能なデータセットは制限され、複数のエージェントに分散する可能性がある。本稿では,BGAN(Breepstorming GAN)アーキテクチャを提案する。
論文参考訳（メタデータ） (2020-02-02T02:58:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。