論文の概要: Graph Conditional Flow Matching for Relational Data Generation
- arxiv url: http://arxiv.org/abs/2505.15668v1
- Date: Wed, 21 May 2025 15:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.750553
- Title: Graph Conditional Flow Matching for Relational Data Generation
- Title(参考訳): リレーショナルデータ生成のためのグラフ条件フローマッチング
- Authors: Davide Scassola, Sebastiano Saccani, Luca Bortolussi,
- Abstract要約: 本稿では,外部キー関係によって生成されたグラフから関係データセットの内容を生成する関係データ生成モデルを提案する。
我々は、フローマッチングにより、関係データベース全体の内容の深い生成モデルを学ぶことによって、これを行う。
我々の方法は、複雑な構造を持つ関係データセットをサポートでき、各レコードの生成は、同じ接続されたコンポーネント内の他のレコードの影響を受けられるので、柔軟である。
- 参考スコア(独自算出の注目度): 0.8823131482758475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data synthesis is gaining momentum as a privacy-enhancing technology. While single-table tabular data generation has seen considerable progress, current methods for multi-table data often lack the flexibility and expressiveness needed to capture complex relational structures. In particular, they struggle with long-range dependencies and complex foreign-key relationships, such as tables with multiple parent tables or multiple types of links between the same pair of tables. We propose a generative model for relational data that generates the content of a relational dataset given the graph formed by the foreign-key relationships. We do this by learning a deep generative model of the content of the whole relational database by flow matching, where the neural network trained to denoise records leverages a graph neural network to obtain information from connected records. Our method is flexible, as it can support relational datasets with complex structures, and expressive, as the generation of each record can be influenced by any other record within the same connected component. We evaluate our method on several benchmark datasets and show that it achieves state-of-the-art performance in terms of synthetic data fidelity.
- Abstract(参考訳): データ合成はプライバシー向上技術として勢いを増している。
単一テーブルの表型データ生成は大きな進歩を遂げているが、現在のマルチテーブルデータの方法は複雑な関係構造を捉えるのに必要な柔軟性と表現力に欠けることが多い。
特に、複数の親テーブルを持つテーブルや、同じテーブル間の複数のタイプのリンクなど、長距離依存や複雑な外部キーの関係に苦しむ。
本稿では,外部キー関係によって生成されたグラフから関係データセットの内容を生成する関係データ生成モデルを提案する。
我々は、フローマッチングにより、関係データベース全体の内容の深い生成モデルを学び、そこで、レコードを識別する訓練されたニューラルネットワークは、グラフニューラルネットワークを利用して、接続されたレコードから情報を取得する。
我々の方法は、複雑な構造を持つ関係データセットをサポートでき、各レコードの生成は、同じ接続されたコンポーネント内の他のレコードの影響を受けられるので、柔軟である。
提案手法をいくつかのベンチマークデータセット上で評価し, 合成データの忠実度の観点から, 最先端の性能を実現することを示す。
関連論文リスト
- Boosting Relational Deep Learning with Pretrained Tabular Models [18.34233986830027]
グラフニューラルネットワーク(GNN)は、これらの関係をモデル化することで本質的に魅力的な代替手段を提供する。
我々のフレームワークは、GNNと比較して最大33%のパフォーマンス改善と526タイムの推論スピードアップを実現しています。
論文 参考訳(メタデータ) (2025-04-07T11:19:04Z) - LLM-TabFlow: Synthetic Tabular Data Generation with Inter-column Logical Relationship Preservation [49.898152180805454]
本研究は,合成表型データ生成におけるカラム間関係の保存について,初めて明示的に検討したものである。
LLM-TabFlowは複雑なカラム間関係と圧縮データをキャプチャする新しい手法であり、Score-based Diffusion を用いて遅延空間における圧縮データの分布をモデル化する。
LLM-TabFlowは、カラム間の関係を完全に保ちながら、データの忠実性、ユーティリティ、プライバシの最良のバランスを保ちながら、すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2025-03-04T00:47:52Z) - Relationships are Complicated! An Analysis of Relationships Between Datasets on the Web [1.02801486034657]
我々は、Web上でデータセットを発見し、使用し、共有するユーザの視点から、データセットの関係について研究する。
まず、Web上のデータセット間の関係を包括的に分類し、これらの関係をデータセット発見中に実行されるユーザタスクにマッピングする。
データセットメタデータを用いた機械学習に基づく手法が,多クラス分類精度の90%を達成できることを実証した。
論文 参考訳(メタデータ) (2024-08-26T21:00:25Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases [39.975491511390985]
グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-12-04T16:54:40Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - MAVEN-ERE: A Unified Large-scale Dataset for Event Coreference,
Temporal, Causal, and Subevent Relation Extraction [78.61546292830081]
アノテーションを改良した大規模EREデータセットMAVEN-EREを構築した。
103,193個のイベント・コア・チェイン、1,216,217個の時間関係、57,992個の因果関係、15,841個の部分関係を含む。
実験の結果,MAVEN-ERE上でのEREは極めて困難であり,共同学習との相互関係を考慮すれば性能が向上することが示された。
論文 参考訳(メタデータ) (2022-11-14T13:34:49Z) - ViRel: Unsupervised Visual Relations Discovery with Graph-level Analogy [65.5580334698777]
ViRelは、グラフレベルのアナロジーを用いた視覚関係の教師なし発見と学習のための方法である。
本研究では,関係分類において95%以上の精度を達成できることを示す。
さらに、より複雑な関係構造を持つ未確認タスクに一般化する。
論文 参考訳(メタデータ) (2022-07-04T16:56:45Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - On Embeddings in Relational Databases [11.52782249184251]
低次元埋め込みを用いた関係データベースにおけるエンティティの分散表現学習の問題に対処する。
近年の埋め込み学習法は,すべてのテーブルの完全結合をリレーショナル化し,知識グラフとして表すことにより,データベースの完全非正規化を考慮に入れたナイーブな手法である。
本稿では,テーブル内の列の基本的なセマンティクスを利用して表現を学習する上で,関係結合と潜時関係を用いて,より優れた方法論を実証する。
論文 参考訳(メタデータ) (2020-05-13T17:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。