論文の概要: AutoG: Towards automatic graph construction from tabular data
- arxiv url: http://arxiv.org/abs/2501.15282v1
- Date: Sat, 25 Jan 2025 17:31:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:55:31.399002
- Title: AutoG: Towards automatic graph construction from tabular data
- Title(参考訳): AutoG: 表データからのグラフ自動構築を目指して
- Authors: Zhikai Chen, Han Xie, Jian Zhang, Xiang song, Jiliang Tang, Huzefa Rangwala, George Karypis,
- Abstract要約: グラフ構築法を形式化し,評価するためのデータセットのセットを導入する。
人間の介入なしに高品質なグラフスキーマを自動的に生成するLLMベースのソリューションAutoGを提案する。
- 参考スコア(独自算出の注目度): 60.877867570524884
- License:
- Abstract: Recent years have witnessed significant advancements in graph machine learning (GML), with its applications spanning numerous domains. However, the focus of GML has predominantly been on developing powerful models, often overlooking a crucial initial step: constructing suitable graphs from common data formats, such as tabular data. This construction process is fundamental to applying graphbased models, yet it remains largely understudied and lacks formalization. Our research aims to address this gap by formalizing the graph construction problem and proposing an effective solution. We identify two critical challenges to achieve this goal: 1. The absence of dedicated datasets to formalize and evaluate the effectiveness of graph construction methods, and 2. Existing automatic construction methods can only be applied to some specific cases, while tedious human engineering is required to generate high-quality graphs. To tackle these challenges, we present a two-fold contribution. First, we introduce a set of datasets to formalize and evaluate graph construction methods. Second, we propose an LLM-based solution, AutoG, automatically generating high-quality graph schemas without human intervention. The experimental results demonstrate that the quality of constructed graphs is critical to downstream task performance, and AutoG can generate high-quality graphs that rival those produced by human experts.
- Abstract(参考訳): 近年、グラフ機械学習(GML)の大幅な進歩が見られ、その用途は多くの領域にまたがっている。
しかし、GMLの焦点は主に強力なモデルの開発であり、しばしば重要な初期ステップを見落としている。
この構成過程はグラフベースのモデルを適用するのに基本的であるが、概ね未検討であり、形式化に欠ける。
本研究は,グラフ構築問題を形式化し,有効解を提案することによって,このギャップに対処することを目的とする。
私たちはこの目標を達成するための2つの重要な課題を特定します。
1.グラフ構築法の有効性を定式化し評価するための専用データセットがないこと、及び
2) 既存の自動工法は特定の場合にのみ適用可能であり, 質の高いグラフを生成するには, 退屈な人的工学が必要である。
これらの課題に取り組むために、私たちは2倍のコントリビューションを提示します。
まず,グラフ構築手法の形式化と評価を行うデータセットのセットを紹介する。
第2に、人間の介入なしに高品質なグラフスキーマを自動的に生成するLLMベースのソリューションAutoGを提案する。
実験の結果,構築したグラフの品質は下流のタスク性能にとって重要であり,AutoGは人間の専門家に匹敵する高品質なグラフを生成することができることがわかった。
関連論文リスト
- Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。
このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。
また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2025-01-01T08:48:53Z) - Towards Data-centric Machine Learning on Directed Graphs: a Survey [23.498557237805414]
本稿では,有向グラフ学習研究のための新しい分類法を提案する。
我々はこれらの手法をデータ中心の観点から再検討し、データ表現の理解と改善に重点を置いている。
我々はこの分野における主要な機会と課題を特定し、有向グラフ学習における将来の研究と開発を導く洞察を提供する。
論文 参考訳(メタデータ) (2024-11-28T06:09:12Z) - Towards Data-centric Graph Machine Learning: Review and Outlook [120.64417630324378]
データ中心グラフ機械学習(DC-GML)という,グラフデータライフサイクルのすべての段階を包含する体系的なフレームワークを導入する。
各段階の完全な分類法が示され、3つの重要なグラフ中心の質問に答える。
我々は、DC-GMLドメインの将来展望を指摘し、その進歩と応用をナビゲートするための洞察を提供する。
論文 参考訳(メタデータ) (2023-09-20T00:40:13Z) - Let There Be Order: Rethinking Ordering in Autoregressive Graph
Generation [6.422073551199993]
条件付きグラフ生成タスクは、入力条件のセットが与えられたグラフを生成するためにモデルを訓練する。
従来の多くの研究では、ノードやエッジなどのグラフコンポーネントを漸進的に生成するために自己回帰モデルを用いていた。
グラフは通常、コンポーネント間で自然な順序付けを欠いているため、グラフをトークンの列に変換することは簡単ではない。
論文 参考訳(メタデータ) (2023-05-24T20:52:34Z) - SCGG: A Deep Structure-Conditioned Graph Generative Model [9.046174529859524]
SCGGと呼ばれる条件付きディープグラフ生成法は、特定のタイプの構造条件を考える。
SCGGのアーキテクチャは、グラフ表現学習ネットワークと、エンドツーエンドで訓練された自己回帰生成モデルで構成されている。
合成と実世界の両方のデータセットに対する実験結果は,最先端のベースラインと比較して,本手法の優位性を示している。
論文 参考訳(メタデータ) (2022-09-20T12:33:50Z) - GraphMAE: Self-Supervised Masked Graph Autoencoders [52.06140191214428]
本稿では,自己教師付きグラフ学習における課題を軽減するマスク付きグラフオートエンコーダGraphMAEを提案する。
我々は3つの異なるグラフ学習タスクに対して、21の公開データセットに関する広範な実験を行った。
その結果,GraphMAEはグラフオートエンコーダであり,設計に注意を払っている。
論文 参考訳(メタデータ) (2022-05-22T11:57:08Z) - Data Augmentation for Deep Graph Learning: A Survey [66.04015540536027]
まず,グラフデータ拡張のための分類法を提案し,その拡張情報モダリティに基づいて関連研究を分類し,構造化されたレビューを提供する。
DGLにおける2つの課題(すなわち、最適グラフ学習と低リソースグラフ学習)に焦点を当て、グラフデータ拡張に基づく既存の学習パラダイムについて議論し、レビューする。
論文 参考訳(メタデータ) (2022-02-16T18:30:33Z) - Structural Information Preserving for Graph-to-Text Generation [59.00642847499138]
グラフ・トゥ・テキスト生成の課題は、入力グラフの意味を保存した文を生成することである。
入力情報を保存するためのモデルとして,より豊かなトレーニング信号を活用することで,この問題に取り組むことを提案する。
グラフからテキストへの生成のための2つのベンチマークに関する実験は、最先端のベースラインに対するアプローチの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-12T20:09:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。