論文の概要: Joint Relational Database Generation via Graph-Conditional Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.16527v1
- Date: Thu, 22 May 2025 11:12:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.247545
- Title: Joint Relational Database Generation via Graph-Conditional Diffusion Models
- Title(参考訳): グラフ畳み込み拡散モデルによる連関関係データベース生成
- Authors: Mohamed Amine Ketata, David Lüdke, Leo Schwinn, Stephan Günnemann,
- Abstract要約: プライバシのデータリリースや実際のデータセットといったアプリケーションでは、データベース(RDB)の生成モデルの構築が重要です。
従来はシングルテーブル生成にフォーカスするか、あるいはテーブルの順序を固定しテーブルを逐次生成する自動回帰因子化に依存していた。
我々は、RDB内のすべてのテーブルを秩序を課すことなく、共同でモデリングするという、根本的に異なるアプローチを提案する。
- 参考スコア(独自算出の注目度): 44.06390394789874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building generative models for relational databases (RDBs) is important for applications like privacy-preserving data release and augmenting real datasets. However, most prior work either focuses on single-table generation or relies on autoregressive factorizations that impose a fixed table order and generate tables sequentially. This approach limits parallelism, restricts flexibility in downstream applications like missing value imputation, and compounds errors due to commonly made conditional independence assumptions. We propose a fundamentally different approach: jointly modeling all tables in an RDB without imposing any order. By using a natural graph representation of RDBs, we propose the Graph-Conditional Relational Diffusion Model (GRDM). GRDM leverages a graph neural network to jointly denoise row attributes and capture complex inter-table dependencies. Extensive experiments on six real-world RDBs demonstrate that our approach substantially outperforms autoregressive baselines in modeling multi-hop inter-table correlations and achieves state-of-the-art performance on single-table fidelity metrics.
- Abstract(参考訳): リレーショナルデータベース(RDB)のジェネレーティブモデルの構築は、プライバシ保護データリリースや実際のデータセットの拡張といったアプリケーションにとって重要である。
しかし、これまでのほとんどの作業はシングルテーブル生成にフォーカスするか、あるいはテーブルの順序を定め、テーブルを逐次生成する自動回帰因子化に依存していた。
このアプローチは並列性を制限し、値計算の欠如や条件付き独立性の仮定による複合エラーのような下流アプリケーションにおける柔軟性を制限する。
我々は、RDB内のすべてのテーブルを秩序を課すことなく、共同でモデリングするという、根本的に異なるアプローチを提案する。
RDBの自然なグラフ表現を用いて,グラフ-連続関係拡散モデル(GRDM)を提案する。
GRDMはグラフニューラルネットワークを利用して、行属性を共同で識別し、複雑なテーブル間の依存関係をキャプチャする。
6つの実世界のRDBに関する大規模な実験により、我々のアプローチはマルチホップのテーブル間相関をモデル化する際の自己回帰ベースラインを大幅に上回り、単一テーブルの忠実度測定における最先端のパフォーマンスを達成することを示した。
関連論文リスト
- Graph Conditional Flow Matching for Relational Data Generation [0.8823131482758475]
本稿では,外部キー関係によって生成されたグラフから関係データセットの内容を生成する関係データ生成モデルを提案する。
我々は、フローマッチングにより、関係データベース全体の内容の深い生成モデルを学ぶことによって、これを行う。
我々の方法は、複雑な構造を持つ関係データセットをサポートでき、各レコードの生成は、同じ接続されたコンポーネント内の他のレコードの影響を受けられるので、柔軟である。
論文 参考訳(メタデータ) (2025-05-21T15:45:15Z) - Relational Graph Transformer [44.56132732108148]
Graph Transformer (Relel) はリレーショナルテーブル用に設計された最初のグラフトランスである。
Relelは、各ノードを5つのコンポーネントに分解する、新しい多要素トークン化戦略を採用している。
我々のアーキテクチャは、サンプル化されたサブグラフに対する局所的な注意と、学習可能なセントロイドに対するグローバルな注意を組み合わせる。
論文 参考訳(メタデータ) (2025-05-16T07:51:58Z) - Boosting Relational Deep Learning with Pretrained Tabular Models [18.34233986830027]
グラフニューラルネットワーク(GNN)は、これらの関係をモデル化することで本質的に魅力的な代替手段を提供する。
我々のフレームワークは、GNNと比較して最大33%のパフォーマンス改善と526タイムの推論スピードアップを実現しています。
論文 参考訳(メタデータ) (2025-04-07T11:19:04Z) - LLM-TabFlow: Synthetic Tabular Data Generation with Inter-column Logical Relationship Preservation [49.898152180805454]
本研究は,合成表型データ生成におけるカラム間関係の保存について,初めて明示的に検討したものである。
LLM-TabFlowは複雑なカラム間関係と圧縮データをキャプチャする新しい手法であり、Score-based Diffusion を用いて遅延空間における圧縮データの分布をモデル化する。
LLM-TabFlowは、カラム間の関係を完全に保ちながら、データの忠実性、ユーティリティ、プライバシの最良のバランスを保ちながら、すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2025-03-04T00:47:52Z) - RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
本稿では,リレーショナルデータベースの特徴を捉えた新しいGNNフレームワークであるRelGNNを紹介する。
我々のアプローチの核となるのは、高次三部構造を形成するノードの列である原子経路の導入である。
RelGNNは、最先端の精度を最大25%改善して一貫して達成している。
論文 参考訳(メタデータ) (2025-02-10T18:58:40Z) - 4DBInfer: A 4D Benchmarking Toolbox for Graph-Centric Predictive Modeling on Relational DBs [67.47600679176963]
RDBは、相互接続されたテーブルにまたがる膨大な量のリッチで情報的なデータを格納する。
予測機械学習モデルの進歩は、コンピュータビジョンや自然言語処理といった他の領域の進歩に遅れをとっている。
マルチテーブルデータセットをグラフに変換することを前提としたベースラインモデルのクラスを探索する。
大規模RDBデータセットと (ii) 同時予測タスクの多様なコレクションを組み立てる。
論文 参考訳(メタデータ) (2024-04-28T15:04:54Z) - Federated Neural Graph Databases [53.03085605769093]
プライバシを保ちながらマルチソースグラフベースのデータの推論を可能にする新しいフレームワークであるFederated Neural Graph Database (FedNGDB)を提案する。
既存の方法とは異なり、FedNGDBは複雑なグラフ構造と関係を扱うことができ、様々な下流タスクに適合する。
論文 参考訳(メタデータ) (2024-02-22T14:57:44Z) - GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-04T16:54:40Z) - Row Conditional-TGAN for generating synthetic relational databases [0.0]
本稿ではRow-Tabular Generative Adversarial Network (RC-TGAN)を提案する。
RC-TGANは、子テーブルのGANの設計に親行の条件データを組み込むことで、テーブル間の関係情報をモデル化する。
論文 参考訳(メタデータ) (2022-11-14T18:14:18Z) - Towards Realistic Low-resource Relation Extraction: A Benchmark with
Empirical Baseline Study [51.33182775762785]
本稿では,低リソース環境下での関係抽出システムを構築するための実証的研究について述べる。
低リソース環境での性能を評価するための3つのスキームについて検討する。 (i) ラベル付きラベル付きデータを用いた異なるタイプのプロンプトベース手法、 (ii) 長期分布問題に対処する多様なバランシング手法、 (iii) ラベル付きインドメインデータを生成するためのデータ拡張技術と自己学習。
論文 参考訳(メタデータ) (2022-10-19T15:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。