論文の概要: RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases
- arxiv url: http://arxiv.org/abs/2506.01360v2
- Date: Tue, 28 Oct 2025 05:17:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:35.916615
- Title: RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases
- Title(参考訳): RDB2G-Bench:関係データベースの自動グラフモデリングのための総合ベンチマーク
- Authors: Dongwon Choi, Sunwoo Kim, Juyeon Kim, Kyungho Kim, Geon Lee, Shinhwan Kang, Myunghwan Kim, Kijung Shin,
- Abstract要約: グラフモデリング手法を評価するための最初のベンチマークフレームワークであるRDB2G-Benchを紹介する。
本研究では,12タスクにおけるRDB-to-graph自動モデリング手法を,オンザフライ評価より約380倍高速にベンチマークする。
データセットとベンチマークの結果から,グラフモデルの有効性に影響を及ぼす重要な構造パターンが明らかになった。
- 参考スコア(独自算出の注目度): 34.357399264742526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances have demonstrated the effectiveness of graph-based learning on relational databases (RDBs) for predictive tasks. Such approaches require transforming RDBs into graphs, a process we refer to as RDB-to-graph modeling, where rows of tables are represented as nodes and foreign-key relationships as edges. Yet, effective modeling of RDBs into graphs remains challenging. Specifically, there exist numerous ways to model RDBs into graphs, and performance on predictive tasks varies significantly depending on the chosen graph model of RDBs. In our analysis, we find that the best-performing graph model can yield up to a 10% higher performance compared to the common heuristic rule for graph modeling, which remains non-trivial to identify. To foster research on intelligent RDB-to-graph modeling, we introduce RDB2G-Bench, the first benchmark framework for evaluating such methods. We construct extensive datasets covering 5 real-world RDBs and 12 predictive tasks, resulting in around 50k graph model-performance pairs for efficient and reproducible evaluations. Thanks to our precomputed datasets, we were able to benchmark 10 automatic RDB-to-graph modeling methods on the 12 tasks about 380x faster than on-the-fly evaluation, which requires repeated GNN training. Our analysis of the datasets and benchmark results reveals key structural patterns affecting graph model effectiveness, along with practical implications for effective graph modeling. Our datasets and code are available at https://github.com/chlehdwon/RDB2G-Bench.
- Abstract(参考訳): 近年,リレーショナルデータベース(RDB)におけるグラフベース学習の有効性が実証されている。
このようなアプローチでは、RDBをグラフに変換する必要があり、RDB-to-graphモデリングと呼ばれるプロセスでは、テーブルの行がノードとして表現され、外部キーの関係がエッジとして表現される。
しかし、グラフへのRDBの効果的なモデリングは依然として困難である。
具体的には、RDBをグラフにモデル化する方法が多数存在し、予測タスクのパフォーマンスは、選択したRDBのグラフモデルによって大きく異なる。
本分析では, グラフモデリングにおける一般的なヒューリスティックなルールと比較して, ベストパフォーマンスのグラフモデルの方が最大10%高い性能が得られることが判明した。
知的RDB-to-graphモデリングの研究を促進するために,そのような手法を評価するための最初のベンチマークフレームワークであるRDB2G-Benchを紹介する。
5つの実世界のRDBと12の予測タスクをカバーする広範囲なデータセットを構築し、その結果、効率よく再現可能な評価のための約50kグラフモデルパフォーマンスペアが得られた。
事前計算したデータセットのおかげで、12のタスクに対して10の自動RDB-to-graphモデリング手法を380倍高速にベンチマークすることができました。
分析結果から,グラフモデルの有効性に影響を及ぼす重要な構造パターンと,効果的なグラフモデリングの実践的意味を明らかにした。
データセットとコードはhttps://github.com/chlehdwon/RDB2G-Bench.comで公開しています。
関連論文リスト
- Beyond Model Base Selection: Weaving Knowledge to Master Fine-grained Neural Network Design [20.31388126105889]
M-DESIGN(M-DESIGN)は、ニューラルネットワークの洗練を習得するためのモデル知識ベース(MKB)パイプラインである。
まず,タスクメタデータに対する適応的なクエリ問題としてモデル修正を再構成する知識織りエンジンを提案する。
ユーザのタスククエリが与えられた場合、M-DESIGNは、グラフ関係の知識スキーマを利用して、候補モデルをすばやくマッチングし、反復的に洗練する。
論文 参考訳(メタデータ) (2025-07-21T07:49:19Z) - Rel-HNN: Split Parallel Hypergraph Neural Network for Learning on Relational Databases [3.6423651166048874]
データベースのフラット化は、ディープラーニングモデルに課題をもたらす。
我々はrel-HNNと呼ばれる新しいハイパーグラフベースのフレームワークを提案する。
rel-HNNは,分類タスクと回帰タスクの両方において,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-07-16T18:20:45Z) - REDELEX: A Framework for Relational Deep Learning Exploration [0.0]
近年、深層学習は、RDBをグラフ構造として概念化する新しいパラダイムとして登場した。
様々なRDLモデルと基礎となるRDBの特徴との関係について分析することができない。
REDELEX$-$aの総合的な探査フレームワークを70以上のRDBの最も多様なコレクション上で、様々な複雑さのRDLモデルを評価する。
論文 参考訳(メタデータ) (2025-06-27T13:05:15Z) - Relational Deep Learning: Challenges, Foundations and Next-Generation Architectures [50.46688111973999]
グラフ機械学習は、任意のグラフ構造化データで学習するモデルの能力を大幅に向上させた。
従来の工学的特徴を伴わない'関係エンティティグラフ'のエンドツーエンド表現を可能にする新しい青写真を提案する。
本稿では、大規模マルチテーブル統合や、時間力学と異種データのモデリングの複雑さなど、重要な課題について論じる。
論文 参考訳(メタデータ) (2025-06-19T23:51:38Z) - Joint Relational Database Generation via Graph-Conditional Diffusion Models [44.06390394789874]
プライバシのデータリリースや実際のデータセットといったアプリケーションでは、データベース(RDB)の生成モデルの構築が重要です。
従来はシングルテーブル生成にフォーカスするか、あるいはテーブルの順序を固定しテーブルを逐次生成する自動回帰因子化に依存していた。
我々は、RDB内のすべてのテーブルを秩序を課すことなく、共同でモデリングするという、根本的に異なるアプローチを提案する。
論文 参考訳(メタデータ) (2025-05-22T11:12:56Z) - RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
RelGNNはリレーショナルデータベースから構築されたグラフのユニークな構造特性を活用するために特別に設計された新しいGNNフレームワークである。
RelGNNは、Relbench(Fey et al., 2024)から30の多様な実世界のタスクで評価され、ほとんどのタスクで最先端のパフォーマンスを実現し、最大25%の改善を実現している。
論文 参考訳(メタデータ) (2025-02-10T18:58:40Z) - Time-Varying Graph Learning for Data with Heavy-Tailed Distribution [15.576923158246428]
グラフモデルは、ネットワーク上で定義されたデータ構造をキャプチャする効率的なツールを提供する。
このようなモデルを学ぶための現在の方法論は、データ内の外れ値に対する堅牢性に欠けることが多い。
本稿では,重み付きデータを効率的に表現できる時間変化グラフモデルの学習問題に対処する。
論文 参考訳(メタデータ) (2024-12-31T19:09:57Z) - Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.00363373925758]
我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。
分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。
BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-09-21T18:39:53Z) - 4DBInfer: A 4D Benchmarking Toolbox for Graph-Centric Predictive Modeling on Relational DBs [67.47600679176963]
RDBは、相互接続されたテーブルにまたがる膨大な量のリッチで情報的なデータを格納する。
予測機械学習モデルの進歩は、コンピュータビジョンや自然言語処理といった他の領域の進歩に遅れをとっている。
マルチテーブルデータセットをグラフに変換することを前提としたベースラインモデルのクラスを探索する。
大規模RDBデータセットと (ii) 同時予測タスクの多様なコレクションを組み立てる。
論文 参考訳(メタデータ) (2024-04-28T15:04:54Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - AutoRC: Improving BERT Based Relation Classification Models via
Architecture Search [50.349407334562045]
BERTに基づく関係分類(RC)モデルは、従来のディープラーニングモデルよりも大幅に改善されている。
最適なアーキテクチャとは何かという合意は得られない。
BERTをベースとしたRCモデルのための包括的検索空間を設計し、設計選択を自動的に検出するためにNAS(Neural Architecture Search)手法を用いる。
論文 参考訳(メタデータ) (2020-09-22T16:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。