論文の概要: Semi-Supervised Heterogeneous Graph Learning with Multi-level Data
Augmentation
- arxiv url: http://arxiv.org/abs/2212.00024v1
- Date: Wed, 30 Nov 2022 14:35:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 15:01:31.728238
- Title: Semi-Supervised Heterogeneous Graph Learning with Multi-level Data
Augmentation
- Title(参考訳): 多レベルデータ拡張による半教師付き不均一グラフ学習
- Authors: Ying Chen, Siwei Qiang, Mingming Ha, Xiaolei Liu, Shaoshuai Li,
Lingfeng Yuan, Xiaobo Guo, and Zhenfeng Zhu
- Abstract要約: 本稿では,HG-MDAを用いた半教師付き異種グラフ学習法を提案する。
DAにおける情報の不均一性の問題として,ノードとトポロジの増大戦略を提案する。
HG-MDAはインターネットファイナンスシナリオのユーザ識別に適用され、ビジネスが30%のキーユーザーを追加するのに役立つ。
- 参考スコア(独自算出の注目度): 8.697773215048286
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, semi-supervised graph learning with data augmentation (DA)
is currently the most commonly used and best-performing method to enhance model
robustness in sparse scenarios with few labeled samples. Differing from
homogeneous graph, DA in heterogeneous graph has greater challenges:
heterogeneity of information requires DA strategies to effectively handle
heterogeneous relations, which considers the information contribution of
different types of neighbors and edges to the target nodes. Furthermore,
over-squashing of information is caused by the negative curvature that formed
by the non-uniformity distribution and strong clustering in complex graph. To
address these challenges, this paper presents a novel method named
Semi-Supervised Heterogeneous Graph Learning with Multi-level Data Augmentation
(HG-MDA). For the problem of heterogeneity of information in DA, node and
topology augmentation strategies are proposed for the characteristics of
heterogeneous graph. And meta-relation-based attention is applied as one of the
indexes for selecting augmented nodes and edges. For the problem of
over-squashing of information, triangle based edge adding and removing are
designed to alleviate the negative curvature and bring the gain of topology.
Finally, the loss function consists of the cross-entropy loss for labeled data
and the consistency regularization for unlabeled data. In order to effectively
fuse the prediction results of various DA strategies, the sharpening is used.
Existing experiments on public datasets, i.e., ACM, DBLP, OGB, and industry
dataset MB show that HG-MDA outperforms current SOTA models. Additionly, HG-MDA
is applied to user identification in internet finance scenarios, helping the
business to add 30% key users, and increase loans and balances by 3.6%, 11.1%,
and 9.8%.
- Abstract(参考訳): 近年,データ拡張(DA)を用いた半教師付きグラフ学習は,サンプル数が少ないスパースシナリオにおいて,モデルロバスト性を向上するための最も一般的な手法である。
異種グラフにおけるdaは、異種グラフと異なり、大きな課題を持っている: 情報の多様性は、異種関係を効果的に扱うためにda戦略を必要とする。
さらに, 複素グラフにおける非一様分布と強いクラスタリングによって形成された負の曲率によって情報の過大な探索が行われる。
本稿では,マルチレベルデータ拡張(hg-mda)を用いた半教師付き不均質グラフ学習という新しい手法を提案する。
DAにおける情報の不均一性の問題に対して、不均一グラフの特性に対してノードおよびトポロジ拡張戦略を提案する。
そして、拡張ノードとエッジを選択するインデックスの1つとしてメタリレーションに基づく注意が適用される。
情報の過剰な探索の問題に対して、三角形に基づくエッジの追加と削除は、負の曲率を緩和し、トポロジーの利得をもたらすように設計されている。
最後に、損失関数はラベル付きデータのクロスエントロピー損失とラベルなしデータの一貫性正規化からなる。
様々なda戦略の予測結果を効果的に融合させるために、シャープニングを用いる。
公開データセット(ACM、DBLP、OGB、業界データセットMB)の既存の実験は、HG-MDAが現在のSOTAモデルより優れていることを示している。
さらに、HG-MDAはインターネットファイナンスシナリオのユーザ識別に適用され、30%のキーユーザーを追加し、ローンと残高を3.6%、11.1%、9.8%増加させる。
関連論文リスト
- Self-Supervised Conditional Distribution Learning on Graphs [15.730933577970687]
本稿では,従来の特徴に対して,弱い特徴と強く拡張された特徴の条件分布を整列するエンドツーエンドグラフ表現学習モデルを提案する。
このアライメントは、グラフ構造化データ拡張による本質的な意味情報の破壊のリスクを効果的に低減する。
論文 参考訳(メタデータ) (2024-11-20T07:26:36Z) - Invariant Graph Learning Meets Information Bottleneck for Out-of-Distribution Generalization [9.116601683256317]
本研究では,情報ボトルネック理論に基づく不変グラフ学習(Invariant Graph Learning)という新しいフレームワークを提案する。
具体的には,環境要因に関連するタスク関連情報を圧縮する冗長フィルタを提案する。
合成と実世界の両方のデータセットを用いた実験により,OODの一般化による最先端性能の実現が実証された。
論文 参考訳(メタデータ) (2024-08-03T07:38:04Z) - The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.83124435649358]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。
最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文 参考訳(メタデータ) (2024-07-12T18:04:32Z) - A GAN Approach for Node Embedding in Heterogeneous Graphs Using Subgraph Sampling [33.50085646298074]
本稿では,グラフニューラルネットワーク (GNN) とGAN (Generative Adrial Network) を組み合わせた新しいフレームワークを提案する。
このフレームワークには高度なエッジ生成と選択モジュールが含まれており、合成ノードとエッジを同時に生成することができる。
論文 参考訳(メタデータ) (2023-12-11T16:52:20Z) - Breaking the Entanglement of Homophily and Heterophily in
Semi-supervised Node Classification [25.831508778029097]
統計的観点から,ノードプロファイルとトポロジの関係を定量化するAMUDを提案する。
また、AMUDのための新しい有向グラフ学習パラダイムとしてADPAを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:54:11Z) - Resisting Graph Adversarial Attack via Cooperative Homophilous
Augmentation [60.50994154879244]
最近の研究では、グラフニューラルネットワークは弱く、小さな摂動によって簡単に騙されることが示されている。
本研究では,グラフインジェクションアタック(Graph Injection Attack)という,新興だが重要な攻撃に焦点を当てる。
本稿では,グラフデータとモデルの協調的同好性増強によるGIAに対する汎用防衛フレームワークCHAGNNを提案する。
論文 参考訳(メタデータ) (2022-11-15T11:44:31Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - A Robust and Generalized Framework for Adversarial Graph Embedding [73.37228022428663]
本稿では,AGE という逆グラフ埋め込みのための頑健なフレームワークを提案する。
AGEは、暗黙の分布から強化された負のサンプルとして偽の隣接ノードを生成する。
本フレームワークでは,3種類のグラフデータを扱う3つのモデルを提案する。
論文 参考訳(メタデータ) (2021-05-22T07:05:48Z) - Multilayer Clustered Graph Learning [66.94201299553336]
我々は、観測された層を代表グラフに適切に集約するために、データ忠実度用語として対照的な損失を用いる。
実験により,本手法がクラスタクラスタw.r.tに繋がることが示された。
クラスタリング問題を解くためのクラスタリングアルゴリズムを学習する。
論文 参考訳(メタデータ) (2020-10-29T09:58:02Z) - Robust Optimization as Data Augmentation for Large-scale Graphs [117.2376815614148]
学習中に勾配に基づく逆方向摂動を伴うノード特徴を反復的に拡張するFLAG(Free Large-scale Adversarial Augmentation on Graphs)を提案する。
FLAGはグラフデータに対する汎用的なアプローチであり、ノード分類、リンク予測、グラフ分類タスクで普遍的に機能する。
論文 参考訳(メタデータ) (2020-10-19T21:51:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。