論文の概要: A Large-Scale Database for Graph Representation Learning
- arxiv url: http://arxiv.org/abs/2011.07682v3
- Date: Sun, 7 Nov 2021 01:48:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 23:31:59.294904
- Title: A Large-Scale Database for Graph Representation Learning
- Title(参考訳): グラフ表現学習のための大規模データベース
- Authors: Scott Freitas, Yuxiao Dong, Joshua Neil, Duen Horng Chau
- Abstract要約: これまでに構築された最大の公開グラフデータベースであるMalNetを紹介します。
MalNetには120万以上のグラフがあり、平均15kノードと35kエッジがある。
一般的なREDDIT-12Kデータベースと比較して、MalNetは105倍のグラフ、平均39倍のグラフ、63倍のクラスを提供している。
- 参考スコア(独自算出の注目度): 20.414835261776304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid emergence of graph representation learning, the construction
of new large-scale datasets is necessary to distinguish model capabilities and
accurately assess the strengths and weaknesses of each technique. By carefully
analyzing existing graph databases, we identify 3 critical components important
for advancing the field of graph representation learning: (1) large graphs, (2)
many graphs, and (3) class diversity. To date, no single graph database offers
all these desired properties. We introduce MalNet, the largest public graph
database ever constructed, representing a large-scale ontology of malicious
software function call graphs. MalNet contains over 1.2 million graphs,
averaging over 15k nodes and 35k edges per graph, across a hierarchy of 47
types and 696 families. Compared to the popular REDDIT-12K database, MalNet
offers 105x more graphs, 39x larger graphs on average, and 63x more classes. We
provide a detailed analysis of MalNet, discussing its properties and
provenance, along with the evaluation of state-of-the-art machine learning and
graph neural network techniques. The unprecedented scale and diversity of
MalNet offers exciting opportunities to advance the frontiers of graph
representation learning--enabling new discoveries and research into imbalanced
classification, explainability and the impact of class hardness. The database
is publicly available at www.mal-net.org.
- Abstract(参考訳): グラフ表現学習の急速な発展に伴い、モデル能力を識別し、各手法の長所と短所を正確に評価するために、新しい大規模データセットの構築が必要である。
既存のグラフデータベースを慎重に分析することにより,(1)大きなグラフ,(2)多くのグラフ,(3)クラス多様性という,グラフ表現学習の分野を進める上で重要な3つの要素を特定する。
これまでのところ、すべての望ましいプロパティを提供する単一のグラフデータベースはありません。
malnetは,悪意のあるソフトウェア関数コールグラフの大規模オントロジーを表現した,史上最大の公開グラフデータベースである。
MalNetには120万以上のグラフがあり、平均で1グラフあたり15kノードと35kエッジがあり、47のタイプと696のファミリーがある。
一般的なREDDIT-12Kデータベースと比較して、MalNetは105倍のグラフ、平均39倍のグラフ、63倍のクラスを提供している。
malnetの詳細な分析を行い、最先端の機械学習とグラフニューラルネットワーク技術の評価とともに、その特性と実績について論じる。
前例のない規模と多様性のmalnetは、グラフ表現学習のフロンティアを前進させるエキサイティングな機会を提供します。
データベースはwww.mal-net.orgで公開されている。
関連論文リスト
- State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - Graph Pooling for Graph Neural Networks: Progress, Challenges, and
Opportunities [128.55790219377315]
グラフニューラルネットワークは多くのグラフレベルのタスクの主要なアーキテクチャとして登場した。
グラフプーリングは、グラフ全体の全体的グラフレベル表現を得るためには不可欠である。
論文 参考訳(メタデータ) (2022-04-15T04:02:06Z) - Edge but not Least: Cross-View Graph Pooling [76.71497833616024]
本稿では,重要なグラフ構造情報を活用するために,クロスビューグラフプーリング(Co-Pooling)手法を提案する。
クロスビュー相互作用、エッジビュープーリング、ノードビュープーリングにより、相互にシームレスに強化され、より情報的なグラフレベルの表現が学習される。
論文 参考訳(メタデータ) (2021-09-24T08:01:23Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z) - Multilevel Graph Matching Networks for Deep Graph Similarity Learning [79.3213351477689]
グラフ構造オブジェクト間のグラフ類似性を計算するためのマルチレベルグラフマッチングネットワーク(MGMN)フレームワークを提案する。
標準ベンチマークデータセットの欠如を補うため、グラフグラフ分類とグラフグラフ回帰タスクの両方のためのデータセットセットを作成し、収集した。
総合的な実験により、MGMNはグラフグラフ分類とグラフグラフ回帰タスクの両方において、最先端のベースラインモデルより一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-07-08T19:48:19Z) - Machine Learning on Graphs: A Model and Comprehensive Taxonomy [22.73365477040205]
グラフニューラルネットワーク、ネットワーク埋め込み、グラフ正規化モデルの間のギャップを埋める。
具体的には、グラフ上の半教師付き学習のための一般的なアルゴリズムを一般化するグラフデコーダモデル( GraphEDM)を提案する。
論文 参考訳(メタデータ) (2020-05-07T18:00:02Z) - SIGN: Scalable Inception Graph Neural Networks [4.5158585619109495]
本稿では,グラフサンプリングの必要性を助長する,効率的でスケーラブルなグラフ深層学習アーキテクチャを提案する。
私たちのアーキテクチャでは、異なるローカルグラフ演算子を使用して、そのタスクに最も適しています。
我々は,1億1000万のノードと15億のエッジを持つ,最大の公開グラフデータセットであるogbn-papers100Mについて,最先端の結果を得た。
論文 参考訳(メタデータ) (2020-04-23T14:46:10Z) - MxPool: Multiplex Pooling for Hierarchical Graph Representation Learning [7.456657747472885]
本稿では,複数のグラフ畳み込み/プールネットワークを同時に利用して,グラフ表現学習タスクの階層的学習構造を構築するMxPoolを提案する。
多数のグラフ分類ベンチマーク実験により、MxPoolは他の最先端グラフ表現学習法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-04-15T01:05:29Z) - Deep Learning for Learning Graph Representations [58.649784596090385]
グラフデータのマイニングはコンピュータ科学においてポピュラーな研究トピックとなっている。
ネットワークデータの膨大な量は、効率的な分析に大きな課題をもたらしている。
これはグラフ表現の出現を動機付け、グラフを低次元ベクトル空間にマッピングする。
論文 参考訳(メタデータ) (2020-01-02T02:13:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。