論文の概要: RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases
- arxiv url: http://arxiv.org/abs/2506.01360v1
- Date: Mon, 02 Jun 2025 06:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.055118
- Title: RDB2G-Bench: A Comprehensive Benchmark for Automatic Graph Modeling of Relational Databases
- Title(参考訳): RDB2G-Bench:関係データベースの自動グラフモデリングのための総合ベンチマーク
- Authors: Dongwon Choi, Sunwoo Kim, Juyeon Kim, Kyungho Kim, Geon Lee, Shinhwan Kang, Myunghwan Kim, Kijung Shin,
- Abstract要約: RDB-to-graphモデリングは、クロステーブルな依存関係をキャプチャするのに役立つ。
グラフモデリングに共通のルールを適用すると、最高のグラフモデルと比較して10%パフォーマンスが低下します。
我々は,そのような手法を評価するための最初のベンチマークフレームワークであるRDB2Gを紹介する。
- 参考スコア(独自算出の注目度): 23.836665904554426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Relational databases (RDBs) are composed of interconnected tables, where relationships between them are defined through foreign keys. Recent research on applying machine learning to RDBs has explored graph-based representations of RDBs, where rows of tables are modeled as nodes, and foreign key relationships are modeled as edges. RDB-to-graph modeling helps capture cross-table dependencies, ultimately leading to enhanced performance across diverse tasks. However, there are numerous ways to model RDBs as graphs, and performance varies significantly depending on the chosen graph model. In our analysis, applying a common heuristic rule for graph modeling leads to up to a 10% drop in performance compared to the best-performing graph model, which remains non-trivial to identify. To foster research on intelligent RDB-to-graph modeling, we introduce RDB2G-Bench, the first benchmark framework for evaluating such methods. We construct extensive datasets covering 5 real-world RDBs and 12 predictive tasks, resulting in around 50k graph-performance pairs for efficient and reproducible evaluations. Thanks to our precomputed datasets, we were able to benchmark 9 automatic RDB-to-graph modeling methods on the 12 tasks over 600x faster than on-the-fly evaluation, which requires repeated model training. Our analysis of the datasets and benchmark results reveals key structural patterns affecting graph model effectiveness, along with practical implications for effective graph modeling.
- Abstract(参考訳): リレーショナルデータベース(RDB)は相互接続されたテーブルで構成され、その間の関係は外部キーを通じて定義される。
機械学習をRDBに適用する最近の研究は、テーブルの行をノードとしてモデル化し、外部キーの関係をエッジとしてモデル化するRDBのグラフベース表現を調査している。
RDB-to-graphモデリングは、クロステーブルな依存関係をキャプチャするのに役立つ。
しかし、RDBをグラフとしてモデル化する方法はたくさんあります。
本分析では、グラフモデリングに共通のヒューリスティックなルールを適用すると、最高のパフォーマンスのグラフモデルと比較して最大10%性能が低下する。
知的RDB-to-graphモデリングの研究を促進するために,そのような手法を評価するための最初のベンチマークフレームワークであるRDB2G-Benchを紹介する。
5つの実世界のRDBと12の予測タスクをカバーする広範囲なデータセットを構築し、その結果、効率よく再現可能な評価のために約50万のグラフパフォーマンスペアが生成される。
事前計算したデータセットのおかげで、繰り返しモデルトレーニングを必要とするオンザフライ評価よりも600倍高速な12タスクに対して、9つのRDB-to-graphモデリング手法をベンチマークすることが可能になった。
分析結果から,グラフモデルの有効性に影響を及ぼす重要な構造パターンと,効果的なグラフモデリングの実践的意味を明らかにした。
関連論文リスト
- Joint Relational Database Generation via Graph-Conditional Diffusion Models [44.06390394789874]
プライバシのデータリリースや実際のデータセットといったアプリケーションでは、データベース(RDB)の生成モデルの構築が重要です。
従来はシングルテーブル生成にフォーカスするか、あるいはテーブルの順序を固定しテーブルを逐次生成する自動回帰因子化に依存していた。
我々は、RDB内のすべてのテーブルを秩序を課すことなく、共同でモデリングするという、根本的に異なるアプローチを提案する。
論文 参考訳(メタデータ) (2025-05-22T11:12:56Z) - Time-Varying Graph Learning for Data with Heavy-Tailed Distribution [15.576923158246428]
グラフモデルは、ネットワーク上で定義されたデータ構造をキャプチャする効率的なツールを提供する。
このようなモデルを学ぶための現在の方法論は、データ内の外れ値に対する堅牢性に欠けることが多い。
本稿では,重み付きデータを効率的に表現できる時間変化グラフモデルの学習問題に対処する。
論文 参考訳(メタデータ) (2024-12-31T19:09:57Z) - Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.00363373925758]
我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。
分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。
BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-09-21T18:39:53Z) - 4DBInfer: A 4D Benchmarking Toolbox for Graph-Centric Predictive Modeling on Relational DBs [67.47600679176963]
RDBは、相互接続されたテーブルにまたがる膨大な量のリッチで情報的なデータを格納する。
予測機械学習モデルの進歩は、コンピュータビジョンや自然言語処理といった他の領域の進歩に遅れをとっている。
マルチテーブルデータセットをグラフに変換することを前提としたベースラインモデルのクラスを探索する。
大規模RDBデータセットと (ii) 同時予測タスクの多様なコレクションを組み立てる。
論文 参考訳(メタデータ) (2024-04-28T15:04:54Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - AutoRC: Improving BERT Based Relation Classification Models via
Architecture Search [50.349407334562045]
BERTに基づく関係分類(RC)モデルは、従来のディープラーニングモデルよりも大幅に改善されている。
最適なアーキテクチャとは何かという合意は得られない。
BERTをベースとしたRCモデルのための包括的検索空間を設計し、設計選択を自動的に検出するためにNAS(Neural Architecture Search)手法を用いる。
論文 参考訳(メタデータ) (2020-09-22T16:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。