論文の概要: PDNS-Net: A Large Heterogeneous Graph Benchmark Dataset of Network
Resolutions for Graph Learning
- arxiv url: http://arxiv.org/abs/2203.07969v1
- Date: Tue, 15 Mar 2022 14:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 21:29:20.970771
- Title: PDNS-Net: A Large Heterogeneous Graph Benchmark Dataset of Network
Resolutions for Graph Learning
- Title(参考訳): PDNS-Net: グラフ学習のためのネットワーク解像度の大規模不均一グラフベンチマークデータセット
- Authors: Udesh Kumarasinghe, Fatih Deniz, Mohamed Nabeel
- Abstract要約: 悪意のあるドメイン分類タスクに対して、447Kノードと897Kエッジを含む最大の公開異種グラフデータセットであるPDNS-Netを紹介する。
一般的な異種データセットであるIMDBとDBLPと比較して、PDNS-Netはそれぞれ38倍と17倍である。
- 参考スコア(独自算出の注目度): 0.7519872646378836
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In order to advance the state of the art in graph learning algorithms, it is
necessary to construct large real-world datasets. While there are many
benchmark datasets for homogeneous graphs, only a few of them are available for
heterogeneous graphs. Furthermore, the latter graphs are small in size
rendering them insufficient to understand how graph learning algorithms perform
in terms of classification metrics and computational resource utilization. We
introduce, PDNS-Net, the largest public heterogeneous graph dataset containing
447K nodes and 897K edges for the malicious domain classification task.
Compared to the popular heterogeneous datasets IMDB and DBLP, PDNS-Net is 38
and 17 times bigger respectively. We provide a detailed analysis of PDNS-Net
including the data collection methodology, heterogeneous graph construction,
descriptive statistics and preliminary graph classification performance. The
dataset is publicly available at https://github.com/qcri/PDNS-Net. Our
preliminary evaluation of both popular homogeneous and heterogeneous graph
neural networks on PDNS-Net reveals that further research is required to
improve the performance of these models on large heterogeneous graphs.
- Abstract(参考訳): グラフ学習アルゴリズムの最先端を進めるためには,大規模な実世界のデータセットを構築する必要がある。
均質グラフのためのベンチマークデータセットは数多く存在するが、ヘテロジニアスグラフで利用可能なものはごくわずかである。
さらに、後者のグラフはサイズが小さく、分類メトリクスと計算資源利用の観点からグラフ学習アルゴリズムがどのように機能するかを理解するのに不十分である。
悪意のあるドメイン分類タスクに対して,447Kノードと897Kエッジを含む公開ヘテロジニアスグラフデータセットであるPDNS-Netを紹介する。
一般的な異種データセットであるIMDBとDBLPと比較して、PDNS-Netはそれぞれ38倍と17倍である。
本研究では,データ収集手法,異種グラフ構築,記述統計,予備グラフ分類性能などを含むPDNS-Netの詳細な解析を行う。
データセットはhttps://github.com/qcri/PDNS-Netで公開されている。
PDNS-Net上での一般的な同種グラフニューラルネットワークと異種グラフニューラルネットワークの予備評価により,これらのモデルの性能向上にはさらなる研究が必要であることが明らかになった。
関連論文リスト
- Spectral Greedy Coresets for Graph Neural Networks [61.24300262316091]
ノード分類タスクにおける大規模グラフの利用は、グラフニューラルネットワーク(GNN)の現実的な応用を妨げる
本稿では,GNNのグラフコアセットについて検討し,スペクトル埋め込みに基づくエゴグラフの選択により相互依存の問題を回避する。
我々のスペクトルグレディグラフコアセット(SGGC)は、数百万のノードを持つグラフにスケールし、モデル事前学習の必要性を排除し、低ホモフィリーグラフに適用する。
論文 参考訳(メタデータ) (2024-05-27T17:52:12Z) - SPGNN: Recognizing Salient Subgraph Patterns via Enhanced Graph Convolution and Pooling [25.555741218526464]
グラフニューラルネットワーク(GNN)は、グラフやネットワークのような非ユークリッドデータ上での機械学習の分野に革命をもたらした。
本稿では,ノード表現をインジェクティブに更新する結合型グラフ畳み込み機構を提案する。
また,WL-SortPoolと呼ばれるグラフプーリングモジュールを設計し,重要なサブグラフパターンをディープラーニングで学習する。
論文 参考訳(メタデータ) (2024-04-21T13:11:59Z) - HUGE: Huge Unsupervised Graph Embeddings with TPUs [6.108914274067702]
グラフ埋め込み(Graph Embedding)は、グラフ内のノードを連続的に表現するプロセスである。
高帯域幅メモリを利用した高性能グラフ埋め込みアーキテクチャを提案する。
実・合成大規模データセット上での埋め込み空間の品質を検証する。
論文 参考訳(メタデータ) (2023-07-26T20:29:15Z) - GRAN is superior to GraphRNN: node orderings, kernel- and graph
embeddings-based metrics for graph generators [0.6816499294108261]
本研究では,グラフ不変量の分布に関するカーネルベースのメトリクスと,グラフ埋め込み空間における多様体ベースのメトリクスとカーネルベースのメトリクスについて検討する。
グラフの2つのよく知られた生成モデルであるGraphRNNとGRANを比較し、ノード順序の影響を明らかにする。
論文 参考訳(メタデータ) (2023-07-13T12:07:39Z) - Seq-HGNN: Learning Sequential Node Representation on Heterogeneous Graph [57.2953563124339]
本稿では,シーケンシャルノード表現,すなわちSeq-HGNNを用いた新しい異種グラフニューラルネットワークを提案する。
Heterogeneous Graph Benchmark (HGB) と Open Graph Benchmark (OGB) の4つの広く使われているデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-05-18T07:27:18Z) - Learning Optimal Graph Filters for Clustering of Attributed Graphs [20.810096547938166]
多くの現実世界のシステムは、システム内の異なるエンティティがノードによって表現され、エッジによって相互作用するグラフとして表現することができる。
グラフィカルな構造を持つ大規模なデータセットを研究する上で重要なタスクはグラフクラスタリングである。
本稿では,FIR(Finite Impulse Response)およびARMA(Autoregressive moving Average)グラフフィルタのパラメータをクラスタリングに最適化したグラフ信号処理手法を提案する。
論文 参考訳(メタデータ) (2022-11-09T01:49:23Z) - A Robust Stacking Framework for Training Deep Graph Models with
Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。
IID(non-graph)データをGNNに簡単に組み込むことはできない。
本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:46:33Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z) - Scalable Graph Neural Networks for Heterogeneous Graphs [12.44278942365518]
グラフニューラルネットワーク(GNN)は、グラフ構造化データを学習するためのパラメトリックモデルの一般的なクラスである。
最近の研究は、GNNが主に機能をスムースにするためにグラフを使用しており、ベンチマークタスクで競合する結果を示していると主張している。
本研究では、これらの結果が異種グラフに拡張可能かどうかを問うとともに、異なるエンティティ間の複数のタイプの関係を符号化する。
論文 参考訳(メタデータ) (2020-11-19T06:03:35Z) - Scaling Graph Neural Networks with Approximate PageRank [64.92311737049054]
GNNにおける情報拡散の効率的な近似を利用したPPRGoモデルを提案する。
高速であることに加えて、PPRGoは本質的にスケーラブルであり、業界設定で見られるような大規模なデータセットに対して、自明に並列化することができる。
このグラフのすべてのノードに対するPPRGoのトレーニングとラベルの予測には1台のマシンで2分未満で、同じグラフ上の他のベースラインをはるかに上回ります。
論文 参考訳(メタデータ) (2020-07-03T09:30:07Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。