論文の概要: arXiv4TGC: Large-Scale Datasets for Temporal Graph Clustering
- arxiv url: http://arxiv.org/abs/2306.04962v1
- Date: Thu, 8 Jun 2023 06:37:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 16:05:47.120463
- Title: arXiv4TGC: Large-Scale Datasets for Temporal Graph Clustering
- Title(参考訳): arXiv4TGC: 時間グラフクラスタリングのための大規模データセット
- Authors: Meng Liu, Ke Liang, Yue Liu, Siwei Wang, Sihang Zhou, Xinwang Liu
- Abstract要約: 我々は、時間グラフクラスタリングのための新しい学術データセットであるarXiv4TGCを構築した。
特に、最大のデータセットであるarXivLargeには、13万のラベル付き利用可能なノードと1000万の時間エッジが含まれている。
arXiv4TGCのクラスタリング性能は、異なるモデルを評価する上でより明白である。
- 参考スコア(独自算出の注目度): 52.63652741011945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal graph clustering (TGC) is a crucial task in temporal graph learning.
Its focus is on node clustering on temporal graphs, and it offers greater
flexibility for large-scale graph structures due to the mechanism of temporal
graph methods. However, the development of TGC is currently constrained by a
significant problem: the lack of suitable and reliable large-scale temporal
graph datasets to evaluate clustering performance. In other words, most
existing temporal graph datasets are in small sizes, and even large-scale
datasets contain only a limited number of available node labels. It makes
evaluating models for large-scale temporal graph clustering challenging. To
address this challenge, we build arXiv4TGC, a set of novel academic datasets
(including arXivAI, arXivCS, arXivMath, arXivPhy, and arXivLarge) for
large-scale temporal graph clustering. In particular, the largest dataset,
arXivLarge, contains 1.3 million labeled available nodes and 10 million
temporal edges. We further compare the clustering performance with typical
temporal graph learning models on both previous classic temporal graph datasets
and the new datasets proposed in this paper. The clustering performance on
arXiv4TGC can be more apparent for evaluating different models, resulting in
higher clustering confidence and more suitable for large-scale temporal graph
clustering. The arXiv4TGC datasets are publicly available at:
https://github.com/MGitHubL/arXiv4TGC.
- Abstract(参考訳): 時間グラフクラスタリング(TGC)は時間グラフ学習において重要な課題である。
その焦点は、時相グラフのノードクラスタリングであり、時相グラフメソッドのメカニズムにより、大規模グラフ構造に対してより柔軟性を提供する。
しかし、TGCの開発は、クラスタリング性能を評価するための適切な、信頼性の高い大規模時間グラフデータセットの欠如という重大な問題に制約されている。
言い換えれば、既存の時間グラフデータセットのほとんどは小さなサイズで、大規模なデータセットでさえも利用可能なノードラベルは限られている。
大規模な時間グラフクラスタリングのためのモデルを評価する。
この課題に対処するため、大規模な時間グラフクラスタリングのための新しい学術データセット(arXivAI、arXivCS、arXivMath、arXivPhy、arXivLargeなど)であるarXiv4TGCを構築した。
特に最大のデータセットであるarxivlargeには、130万のラベル付き利用可能なノードと1000万のテンポラリエッジが含まれている。
さらに,クラスタリング性能を,従来の時間グラフデータセットと,本論文で提案した新しいデータセットの双方において,典型的な時間グラフ学習モデルと比較する。
arXiv4TGCのクラスタリング性能は、異なるモデルを評価する上でより明らかになり、クラスタリングの信頼性が高く、大規模な時間グラフクラスタリングに適している。
arXiv4TGCデータセットは、https://github.com/MGitHubL/arXiv4TGCで公開されている。
関連論文リスト
- Spectral Greedy Coresets for Graph Neural Networks [61.24300262316091]
ノード分類タスクにおける大規模グラフの利用は、グラフニューラルネットワーク(GNN)の現実的な応用を妨げる
本稿では,GNNのグラフコアセットについて検討し,スペクトル埋め込みに基づくエゴグラフの選択により相互依存の問題を回避する。
我々のスペクトルグレディグラフコアセット(SGGC)は、数百万のノードを持つグラフにスケールし、モデル事前学習の必要性を排除し、低ホモフィリーグラフに適用する。
論文 参考訳(メタデータ) (2024-05-27T17:52:12Z) - LSEnet: Lorentz Structural Entropy Neural Network for Deep Graph Clustering [59.89626219328127]
グラフクラスタリングは機械学習の基本的な問題である。
近年、ディープラーニング手法は最先端の成果を達成しているが、事前に定義されたクラスタ番号なしでは動作できない。
本稿では,グラフ情報理論の新たな視点からこの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-05-20T05:46:41Z) - Deep Temporal Graph Clustering [77.02070768950145]
深部時間グラフクラスタリング(GC)のための汎用フレームワークを提案する。
GCは、時間グラフの相互作用シーケンスに基づくバッチ処理パターンに適合するディープクラスタリング技術を導入している。
我々のフレームワークは、既存の時間グラフ学習手法の性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2023-05-18T06:17:50Z) - Clustering of Time-Varying Graphs Based on Temporal Label Smoothness [28.025212175496964]
本稿では,クラスタラベルが時間とともにスムーズに変化するという仮定に基づいて,時間変化グラフのノードクラスタリング手法を提案する。
提案手法の有効性を検証するために,合成および実世界の時間変化グラフの実験を行った。
論文 参考訳(メタデータ) (2023-05-11T05:20:41Z) - Simplified Graph Convolution with Heterophily [25.7577503312319]
単純グラフ畳み込み(SGC)は異種グラフ(非同種グラフ)には有効でないことを示す。
本稿では、同好性グラフ構造と異好性グラフ構造の両方に適応できる適応的単純グラフ畳み込み(ASGC)を提案する。
論文 参考訳(メタデータ) (2022-02-08T20:52:08Z) - AnchorGAE: General Data Clustering via $O(n)$ Bipartite Graph
Convolution [79.44066256794187]
我々は、グラフ畳み込みネットワーク(GCN)を構築するために使用される生成グラフモデルを導入することにより、グラフに非グラフデータセットを変換する方法を示す。
アンカーによって構築された二部グラフは、データの背後にある高レベル情報を利用するために動的に更新される。
理論的には、単純な更新が退化につながることを証明し、それに従って特定の戦略が設計される。
論文 参考訳(メタデータ) (2021-11-12T07:08:13Z) - Weighted Graph Nodes Clustering via Gumbel Softmax [0.0]
重み付きグラフデータセットのクラスタリングのためのグラフクラスタリングアルゴリズムの研究成果について述べる。
アルゴリズムをGumbel Softmax(WGCGS)を介して重み付きグラフノードクラスタリングと呼びます。
論文 参考訳(メタデータ) (2021-02-22T05:05:35Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。