論文の概要: UniKG: A Benchmark and Universal Embedding for Large-Scale Knowledge
Graphs
- arxiv url: http://arxiv.org/abs/2309.05269v1
- Date: Mon, 11 Sep 2023 06:56:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 13:39:47.569923
- Title: UniKG: A Benchmark and Universal Embedding for Large-Scale Knowledge
Graphs
- Title(参考訳): UniKG: 大規模知識グラフのためのベンチマークとユニバーサル埋め込み
- Authors: Yide Qiu, Shaoxiang Ling, Tong Zhang, Bo Huang, Zhen Cui
- Abstract要約: 我々はWikidataからUniKGという大規模な異種グラフベンチマークデータセットを構築した。
UniKGには7700万以上のマルチ属性エンティティと2000の多様なアソシエーションタイプが含まれている。
本稿では, 効率的なマルチホップ異方性伝搬カーネルを学習するための, プラグアンドプレイ異方性伝搬モジュール (APM) を提案する。
- 参考スコア(独自算出の注目度): 19.13467673464939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Irregular data in real-world are usually organized as heterogeneous graphs
(HGs) consisting of multiple types of nodes and edges. To explore useful
knowledge from real-world data, both the large-scale encyclopedic HG datasets
and corresponding effective learning methods are crucial, but haven't been well
investigated. In this paper, we construct a large-scale HG benchmark dataset
named UniKG from Wikidata to facilitate knowledge mining and heterogeneous
graph representation learning. Overall, UniKG contains more than 77 million
multi-attribute entities and 2000 diverse association types, which
significantly surpasses the scale of existing HG datasets. To perform effective
learning on the large-scale UniKG, two key measures are taken, including (i)
the semantic alignment strategy for multi-attribute entities, which projects
the feature description of multi-attribute nodes into a common embedding space
to facilitate node aggregation in a large receptive field; (ii) proposing a
novel plug-and-play anisotropy propagation module (APM) to learn effective
multi-hop anisotropy propagation kernels, which extends methods of large-scale
homogeneous graphs to heterogeneous graphs. These two strategies enable
efficient information propagation among a tremendous number of multi-attribute
entities and meantimes adaptively mine multi-attribute association through the
multi-hop aggregation in large-scale HGs. We set up a node classification task
on our UniKG dataset, and evaluate multiple baseline methods which are
constructed by embedding our APM into large-scale homogenous graph learning
methods. Our UniKG dataset and the baseline codes have been released at
https://github.com/Yide-Qiu/UniKG.
- Abstract(参考訳): 実世界の不規則データは、通常、複数の種類のノードとエッジからなる異種グラフ(HG)として構成される。
実世界のデータから有用な知識を探求するためには、大規模な百科事典HGデータセットとそれに対応する効果的な学習方法の両方が重要であるが、十分に研究されていない。
本稿では,知識マイニングと異種グラフ表現学習を容易にするため,WikidataからUniKGという大規模HGベンチマークデータセットを構築した。
全体として、UniKGには7700万以上のマルチ属性エンティティと2000の多様なアソシエーションタイプが含まれており、既存のHGデータセットの規模を大きく上回っている。
大規模UniKGを効果的に学習するためには,2つの重要な対策が講じられる。
(i)多属性ノードの特徴記述を共通埋め込み空間に投影し、大きな受容領域におけるノードの集約を容易にする多属性エンティティのセマンティックアライメント戦略
(II) マルチホップ異方性伝播カーネルを学習するために, 新規なプラグアンドプレイ異方性伝搬モジュール(APM)を提案し, 大規模等質グラフの手法を異質グラフに拡張した。
これらの2つの戦略は,大規模HGにおけるマルチホップアグリゲーションを通じて,膨大な数のマルチアトリビュートエンティティ間の効率的な情報伝達を可能にし,その間に多アトリビュートアソシエーションを適応的にマイニングする。
我々は,UniKGデータセット上にノード分類タスクを設定し,APMを大規模同種グラフ学習手法に組み込んで構築した複数のベースライン手法を評価する。
UniKGデータセットとベースラインコードはhttps://github.com/Yide-Qiu/UniKGでリリースされています。
関連論文リスト
- DA-MoE: Addressing Depth-Sensitivity in Graph-Level Analysis through Mixture of Experts [70.21017141742763]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理することで人気を集めている。
既存のメソッドは通常、固定数のGNNレイヤを使用して、すべてのグラフの表現を生成する。
本稿では,GNNに2つの改良を加えたDA-MoE法を提案する。
論文 参考訳(メタデータ) (2024-11-05T11:46:27Z) - Language Models are Graph Learners [70.14063765424012]
言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端のGNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T08:27:54Z) - Effective Clustering on Large Attributed Bipartite Graphs [10.701751248623863]
分散二部グラフ(ABG)は、2つの異種ノード間の相互作用を記述するための表現型データモデルである。
このようなグラフに設定された対象ノードを(k-ABGCと呼ばれる) k 個の非連結クラスタに分割すると、様々な領域で広く使われるようになる。
しかし、k-ABGCに対する既存の解のほとんどは、属性情報を見渡すか、二部グラフ構造を正確に捉えないかのいずれかである。
我々は,複数の実データセット上でのスーパーブクラスタリング性能を実現する,k-ABGCの効率的かつ効率的なアプローチであるTPOを提案する。
論文 参考訳(メタデータ) (2024-05-20T09:58:27Z) - Hierarchical Aggregations for High-Dimensional Multiplex Graph Embedding [7.271256448682229]
HMGEは高次元多重グラフの階層的アグリゲーションに基づく新しい埋め込み手法である。
我々は、ローカルパッチとグローバルサマリー間の相互情報を活用して、監督なしにモデルを訓練する。
合成および実世界のデータに関する詳細な実験は、下流監視タスクに対する我々のアプローチの適合性を示している。
論文 参考訳(メタデータ) (2023-12-28T05:39:33Z) - DGCLUSTER: A Neural Framework for Attributed Graph Clustering via
Modularity Maximization [5.329981192545312]
本稿では,グラフニューラルネットワークを用いてモジュラリティの目的を最適化し,グラフサイズと線形にスケールする新しい手法DGClusterを提案する。
私たちはDGClusterを、さまざまなサイズの実世界のデータセットで、複数の一般的なクラスタ品質メトリクスで広範囲にテストしています。
われわれの手法は最先端の手法よりも一貫して優れており、ほぼすべての設定で顕著な性能向上を示している。
論文 参考訳(メタデータ) (2023-12-20T01:43:55Z) - Efficient Multi-View Graph Clustering with Local and Global Structure
Preservation [59.49018175496533]
局所・グローバル構造保存を用いた効率的なマルチビューグラフクラスタリング(EMVGC-LG)という,アンカーベースのマルチビューグラフクラスタリングフレームワークを提案する。
具体的には、EMVGC-LGがクラスタリング品質を向上させるために、アンカー構築とグラフ学習を共同で最適化する。
さらに、EMVGC-LGはサンプル数に関する既存のAMVGCメソッドの線形複雑性を継承する。
論文 参考訳(メタデータ) (2023-08-31T12:12:30Z) - Cross-heterogeneity Graph Few-shot Learning [9.80898395055038]
本稿では,異種間グラフFew-shot Learning,すなわちCGFLの新たなモデルを提案する。
CGFLでは,まず異種情報を取得するメタパターンを抽出する。
そこで我々は,ラベル付きサンプルの情報量を測定するスコアモジュールを提案し,各ソースHGの転送可能性を決定する。
論文 参考訳(メタデータ) (2023-08-10T01:25:28Z) - Graph Mixture of Experts: Learning on Large-Scale Graphs with Explicit
Diversity Modeling [60.0185734837814]
グラフニューラルネットワーク(GNN)は、グラフデータからの学習に広く応用されている。
GNNの一般化能力を強化するため、グラフ強化のような技術を用いて、トレーニンググラフ構造を増強することが慣例となっている。
本研究では,GNNにMixture-of-Experts(MoE)の概念を導入する。
論文 参考訳(メタデータ) (2023-04-06T01:09:36Z) - SHGNN: Structure-Aware Heterogeneous Graph Neural Network [77.78459918119536]
本稿では、上記の制約に対処する構造対応不均一グラフニューラルネットワーク(SHGNN)を提案する。
まず,メタパス内の中間ノードの局所構造情報を取得するために,特徴伝搬モジュールを利用する。
次に、ツリーアテンションアグリゲータを使用して、グラフ構造情報をメタパス上のアグリゲーションモジュールに組み込む。
最後に、メタパスアグリゲータを利用して、異なるメタパスから集約された情報を融合する。
論文 参考訳(メタデータ) (2021-12-12T14:18:18Z) - HeMI: Multi-view Embedding in Heterogeneous Graphs [8.87527266373087]
不均一グラフ(HG)の表現学習は、そのようなグラフの豊富な構造と意味を低次元空間に埋め込む。
本稿では,HGの構造的セマンティクス間の知識交換と発見に依存して,HG表現を学習する自己教師型手法を提案する。
提案手法は,全タスクにおいて1%,最大10%の効率で性能が向上し,競合手法の改善が図られている。
論文 参考訳(メタデータ) (2021-09-14T23:04:42Z) - Attention-driven Graph Clustering Network [49.040136530379094]
我々は、注意駆動グラフクラスタリングネットワーク(AGCN)という新しいディープクラスタリング手法を提案する。
AGCNは、ノード属性特徴とトポロジグラフ特徴を動的に融合するために、不均一な融合モジュールを利用する。
AGCNは、教師なしの方法で特徴学習とクラスタ割り当てを共同で行うことができる。
論文 参考訳(メタデータ) (2021-08-12T02:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。