論文の概要: GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases
- arxiv url: http://arxiv.org/abs/2312.02037v1
- Date: Mon, 4 Dec 2023 16:54:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 14:28:55.674289
- Title: GFS: Graph-based Feature Synthesis for Prediction over Relational
Databases
- Title(参考訳): GFS:関係データベース上の予測のためのグラフベースの特徴合成
- Authors: Han Zhang, Quan Gan, David Wipf, Weinan Zhang
- Abstract要約: グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを異種グラフデータベースとして定式化する。
4つの実世界のマルチテーブルリレーショナルデータベースに対する実験では、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 39.975491511390985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Relational databases are extensively utilized in a variety of modern
information system applications, and they always carry valuable data patterns.
There are a huge number of data mining or machine learning tasks conducted on
relational databases. However, it is worth noting that there are limited
machine learning models specifically designed for relational databases, as most
models are primarily tailored for single table settings. Consequently, the
prevalent approach for training machine learning models on data stored in
relational databases involves performing feature engineering to merge the data
from multiple tables into a single table and subsequently applying single table
models. This approach not only requires significant effort in feature
engineering but also destroys the inherent relational structure present in the
data. To address these challenges, we propose a novel framework called
Graph-based Feature Synthesis (GFS). GFS formulates the relational database as
a heterogeneous graph, thereby preserving the relational structure within the
data. By leveraging the inductive bias from single table models, GFS
effectively captures the intricate relationships inherent in each table.
Additionally, the whole framework eliminates the need for manual feature
engineering. In the extensive experiment over four real-world multi-table
relational databases, GFS outperforms previous methods designed for relational
databases, demonstrating its superior performance.
- Abstract(参考訳): リレーショナルデータベースは、現代の様々な情報システムアプリケーションで広く使われており、常に貴重なデータパターンを持っている。
リレーショナルデータベースでは、大量のデータマイニングや機械学習タスクが行われています。
しかしながら、ほとんどのモデルが主に単一のテーブル設定用に調整されているため、リレーショナルデータベース用に特別に設計された限定された機械学習モデルがあることに注意が必要だ。
したがって、リレーショナルデータベースに格納されたデータで機械学習モデルをトレーニングするための一般的なアプローチは、複数のテーブルからデータを1つのテーブルにマージし、その後1つのテーブルモデルを適用する機能エンジニアリングを行うことである。
このアプローチは機能エンジニアリングに多大な労力を必要とするだけでなく、データに存在する固有のリレーショナル構造を破壊します。
これらの課題に対処するために,グラフベース特徴合成(GFS)と呼ばれる新しいフレームワークを提案する。
GFSは関係データベースを不均一グラフとして定式化し、データ内の関係構造を保存する。
単一テーブルモデルからの帰納バイアスを活用することで、GFSは各テーブル固有の複雑な関係を効果的にキャプチャする。
さらに、フレームワーク全体が手動の機能エンジニアリングの必要性をなくしている。
4つの実世界のマルチテーブルリレーショナルデータベースに対する広範な実験において、GFSはリレーショナルデータベース用に設計された従来の手法よりも優れており、その優れた性能を示している。
関連論文リスト
- Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - Neural Graph Reasoning: Complex Logical Query Answering Meets Graph
Databases [63.96793270418793]
複雑な論理クエリ応答(CLQA)は、グラフ機械学習の最近登場したタスクである。
ニューラルグラフデータベース(NGDB)の概念を紹介する。
NGDBはNeural Graph StorageとNeural Graph Engineで構成されている。
論文 参考訳(メタデータ) (2023-03-26T04:03:37Z) - REaLTabFormer: Generating Realistic Relational and Tabular Data using
Transformers [0.0]
本稿では,合成データ生成モデルであるREaLTabFormer(Realistic and Tabular Transformer)を紹介する。
まず、自己回帰GPT-2モデルを用いて親テーブルを生成し、その後、シーケンス・ツー・シーケンスモデルを用いて親テーブル上で条件付けられた関係データセットを生成する。
実世界のデータセットを用いた実験では、REaLTabFormerはモデルベースラインよりもリレーショナル構造をよりよくキャプチャする。
論文 参考訳(メタデータ) (2023-02-04T00:32:50Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - BERT Meets Relational DB: Contextual Representations of Relational
Databases [4.029818252558553]
複数のテーブルからなる関係データベース上でエンティティの低次元表現を学習する問題に対処する。
これらの注意に基づくモデルを使用して、リレーショナルデータベース内のエンティティの埋め込みを学ぶ方法を検討します。
論文 参考訳(メタデータ) (2021-04-30T11:23:26Z) - GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing [117.98107557103877]
テーブルセマンティック解析のための効果的な事前学習手法GraPPaを提案する。
我々は、同期文脈自由文法を用いて、高自由度テーブル上に合成質問ペアを構築する。
実世界のデータを表現できるモデルの能力を維持するため、マスキング言語モデリングも含んでいる。
論文 参考訳(メタデータ) (2020-09-29T08:17:58Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - On Embeddings in Relational Databases [11.52782249184251]
低次元埋め込みを用いた関係データベースにおけるエンティティの分散表現学習の問題に対処する。
近年の埋め込み学習法は,すべてのテーブルの完全結合をリレーショナル化し,知識グラフとして表すことにより,データベースの完全非正規化を考慮に入れたナイーブな手法である。
本稿では,テーブル内の列の基本的なセマンティクスを利用して表現を学習する上で,関係結合と潜時関係を用いて,より優れた方法論を実証する。
論文 参考訳(メタデータ) (2020-05-13T17:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。