論文の概要: Griffin: Towards a Graph-Centric Relational Database Foundation Model
- arxiv url: http://arxiv.org/abs/2505.05568v2
- Date: Wed, 11 Jun 2025 17:37:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 02:07:43.196847
- Title: Griffin: Towards a Graph-Centric Relational Database Foundation Model
- Title(参考訳): Griffin: グラフ中心のリレーショナルデータベース基盤モデルを目指して
- Authors: Yanbo Wang, Xiyuan Wang, Quan Gan, Minjie Wang, Qibin Yang, David Wipf, Muhan Zhang,
- Abstract要約: Griffinはデータベース(RDB)用に特別に設計された最初の基礎モデルの試みである
我々は、クロスアテンションモジュールと新しいアグリゲータを組み込むことで、アーキテクチャを強化する。
グリフィンは、様々な領域にわたるRDBから抽出された大規模、異質、および時間グラフで評価される。
- 参考スコア(独自算出の注目度): 37.09648739513178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Griffin, the first foundation model attemptation designed specifically for Relational Databases (RDBs). Unlike previous smaller models focused on single RDB tasks, Griffin unifies the data encoder and task decoder to handle diverse tasks. Additionally, we enhance the architecture by incorporating a cross-attention module and a novel aggregator. Griffin utilizes pretraining on both single-table and RDB datasets, employing advanced encoders for categorical, numerical, and metadata features, along with innovative components such as cross-attention modules and enhanced message-passing neural networks (MPNNs) to capture the complexities of relational data. Evaluated on large-scale, heterogeneous, and temporal graphs extracted from RDBs across various domains (spanning over 150 million nodes), Griffin demonstrates superior or comparable performance to individually trained models, excels in low-data scenarios, and shows strong transferability with similarity and diversity in pretraining across new datasets and tasks, highlighting its potential as a universally applicable foundation model for RDBs. Code available at https://github.com/yanxwb/Griffin.
- Abstract(参考訳): 我々は、関係データベース(RDB)用に特別に設計された最初の基礎モデル試みであるGriffinを紹介します。
単一のRDBタスクに焦点を当てた以前の小さなモデルとは異なり、Griffinはデータエンコーダとタスクデコーダを統一して多様なタスクを処理する。
さらに,クロスアテンションモジュールと新しいアグリゲータを組み込むことで,アーキテクチャの強化を図る。
Griffinは、単一テーブルとRDBデータセットの両方で事前トレーニングを使用して、高度なエンコーダをカテゴリ、数値、メタデータの特徴として使用するとともに、クロスアテンションモジュールや拡張メッセージパスニューラルネットワーク(MPNN)といった革新的なコンポーネントを使用して、リレーショナルデータの複雑さをキャプチャする。
さまざまなドメイン(1億5000万ノードを超える)にわたるRDBから抽出された大規模、異種、時間グラフに基づいて評価されたGriffin氏は、個別に訓練されたモデルよりも優れた、あるいは同等のパフォーマンスを示し、ローデータシナリオに優れ、新しいデータセットやタスクを事前トレーニングする際の類似性と多様性を備えた強力な転送可能性を示し、RDBの普遍的に適用可能な基盤モデルとしての可能性を強調している。
コードはhttps://github.com/yanxwb/Griffin.comで公開されている。
関連論文リスト
- Scalable Weibull Graph Attention Autoencoder for Modeling Document Networks [50.42343781348247]
解析条件後部を解析し,推論精度を向上させるグラフポアソン因子分析法(GPFA)を開発した。
また,GPFAを多層構造に拡張したグラフPoisson gamma belief Network (GPGBN) を用いて,階層的な文書関係を複数の意味レベルで捉える。
本モデルでは,高品質な階層型文書表現を抽出し,様々なグラフ解析タスクにおいて有望な性能を実現する。
論文 参考訳(メタデータ) (2024-10-13T02:22:14Z) - RelBench: A Benchmark for Deep Learning on Relational Databases [78.52438155603781]
本稿では,グラフニューラルネットワークを用いたデータベース上でタスクを解くための公開ベンチマークであるRelBenchを紹介する。
私たちはRelBenchを使って、ディープラーニングインフラストラクチャに関する初の総合的な研究を行っています。
RDLは、人間の作業量を1桁以上削減しながら、より良く学習する。
論文 参考訳(メタデータ) (2024-07-29T14:46:13Z) - 4DBInfer: A 4D Benchmarking Toolbox for Graph-Centric Predictive Modeling on Relational DBs [67.47600679176963]
RDBは、相互接続されたテーブルにまたがる膨大な量のリッチで情報的なデータを格納する。
予測機械学習モデルの進歩は、コンピュータビジョンや自然言語処理といった他の領域の進歩に遅れをとっている。
マルチテーブルデータセットをグラフに変換することを前提としたベースラインモデルのクラスを探索する。
大規模RDBデータセットと (ii) 同時予測タスクの多様なコレクションを組み立てる。
論文 参考訳(メタデータ) (2024-04-28T15:04:54Z) - Replica Tree-based Federated Learning using Limited Data [6.572149681197959]
本研究では,RepTreeFLという新しいフェデレーション学習フレームワークを提案する。
ソリューションの中核はレプリカの概念であり、モデルアーキテクチャをコピーし、ローカルなデータ分散を摂動することで、各クライアントを複製します。
当社のアプローチでは,データ分布の多様さで多数のモデルを集約することで,限られたデータと少数のクライアントから学習することが可能である。
論文 参考訳(メタデータ) (2023-12-28T17:47:25Z) - SPARE: A Single-Pass Neural Model for Relational Databases [36.55513135391452]
我々は、GNNと同様の精度を提供しながら、RDB上で効率的にトレーニングできる新しいニューラルネットワーククラスであるSPAREを提案する。
GNNとは異なる効率的なトレーニングを可能にするため、SPAREでは、RDB内のデータが予測正則構造を持つという事実を活用している。
論文 参考訳(メタデータ) (2023-10-20T15:23:17Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - InPars: Data Augmentation for Information Retrieval using Large Language
Models [5.851846467503597]
本研究では,大規模な事前学習型言語モデルの,情報検索タスクのための合成データ生成機能を利用する。
我々は、教師なしデータセットのみに微調整されたモデルが、BM25のような強力なベースラインより優れていることを示す。
教師付きデータと我々の合成データの両方に微調整されたレトリバーは、教師付きデータにのみ微調整されたモデルよりも優れたゼロショット転送を実現する。
論文 参考訳(メタデータ) (2022-02-10T16:52:45Z) - TabGNN: Multiplex Graph Neural Network for Tabular Data Prediction [43.35301059378836]
最近普及しているグラフニューラルネットワーク(GNN)に基づく新しいフレームワークTabGNNを提案する。
具体的には,まず,多面的サンプル関係をモデル化するための多重グラフを構築し,次に,各サンプルに対する拡張表現を学習するための多重グラフニューラルネットワークを設計する。
分類と回帰を含む11のTDPデータセットに対する実験は、TabGNNが一貫して性能を向上できることを示している。
論文 参考訳(メタデータ) (2021-08-20T11:51:32Z) - Principal Neighbourhood Aggregation for Graph Nets [4.339839287869653]
グラフニューラルネットワーク(GNN)は、グラフ構造化データ上の様々な予測タスクに有効なモデルであることが示されている。
表現力に関する最近の研究は同型タスクと可算特徴空間に焦点を当てている。
我々はこの理論フレームワークを拡張し、現実世界の入力領域で定期的に発生する連続的な特徴を含める。
論文 参考訳(メタデータ) (2020-04-12T23:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。