論文の概要: Local Graph Clustering with Noisy Labels
- arxiv url: http://arxiv.org/abs/2310.08031v2
- Date: Mon, 4 Mar 2024 02:57:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 02:08:44.919242
- Title: Local Graph Clustering with Noisy Labels
- Title(参考訳): 雑音ラベルを用いた局所グラフクラスタリング
- Authors: Artur Back de Luca, Kimon Fountoulakis, Shenghao Yang
- Abstract要約: 本稿では,ノード情報追加のプロキシとしてノイズの多いノードラベルを用いた局所グラフクラスタリングを提案する。
この設定では、ノードはクラスタのアフィリエイトに基づいて初期バイナリラベルを受け取る。
属性グラフから数個のサンプルを用いて,信頼性の高いノードラベルが得られることを示す。
- 参考スコア(独自算出の注目度): 8.142265733890918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing interest in machine learning problems over graphs with additional
node information such as texts, images, or labels has popularized methods that
require the costly operation of processing the entire graph. Yet, little effort
has been made to the development of fast local methods (i.e. without accessing
the entire graph) that extract useful information from such data. To that end,
we propose a study of local graph clustering using noisy node labels as a proxy
for additional node information. In this setting, nodes receive initial binary
labels based on cluster affiliation: 1 if they belong to the target cluster and
0 otherwise. Subsequently, a fraction of these labels is flipped. We
investigate the benefits of incorporating noisy labels for local graph
clustering. By constructing a weighted graph with such labels, we study the
performance of graph diffusion-based local clustering method on both the
original and the weighted graphs. From a theoretical perspective, we consider
recovering an unknown target cluster with a single seed node in a random graph
with independent noisy node labels. We provide sufficient conditions on the
label noise under which, with high probability, using diffusion in the weighted
graph yields a more accurate recovery of the target cluster. This approach
proves more effective than using the given labels alone or using diffusion in
the label-free original graph. Empirically, we show that reliable node labels
can be obtained with just a few samples from an attributed graph. Moreover,
utilizing these labels via diffusion in the weighted graph leads to
significantly better local clustering performance across several real-world
datasets, improving F1 scores by up to 13%.
- Abstract(参考訳): テキスト、画像、ラベルなどの追加ノード情報を持つグラフに対する機械学習問題への関心が高まり、グラフ全体の処理にコストを要するメソッドが一般化した。
しかし、そのようなデータから有用な情報を抽出する高速ローカルメソッド(グラフ全体にアクセスすることなく)の開発には、ほとんど努力が払われていない。
そこで本研究では,ノード情報追加のプロキシとしてノイズノードラベルを用いた局所グラフクラスタリングを提案する。
この設定では、ノードはクラスタのアフィリエイトに基づいて初期バイナリラベルを受け取る。
その後、これらのラベルのほんの一部が反転する。
局所グラフクラスタリングにノイズラベルを組み込むことの利点について検討する。
そこで,このようなラベル付き重み付きグラフを構築し,グラフ拡散に基づく局所クラスタリング手法の性能について検討した。
理論的観点から、独立ノイズノードラベルを持つランダムグラフにおいて、単一のシードノードを持つ未知のターゲットクラスタを復元することを検討する。
重み付きグラフの拡散を高い確率で利用することで、ターゲットクラスタのより正確な回復を可能にするラベルノイズの十分な条件を提供する。
このアプローチは、与えられたラベルだけを使うか、ラベルのない元のグラフで拡散を使うよりも効果的である。
実験により,属性付きグラフから数個のサンプルを用いて,信頼性の高いノードラベルが得られることを示す。
さらに、重み付きグラフの拡散によるこれらのラベルの利用により、複数の実世界のデータセット間の局所クラスタリング性能が大幅に向上し、F1スコアが最大13%向上する。
関連論文リスト
- Resurrecting Label Propagation for Graphs with Heterophily and Label Noise [40.11022005996222]
ラベルノイズは、ディープニューラルネットワークの一般化能力を著しく低下させるため、大規模なデータセットでは一般的な課題である。
任意のヘテロフィリーの文脈におけるグラフラベルノイズについて検討し、ノイズラベルの修正とラベルの割り当てを未ラベルノードで行うことを目的とした。
R2LP$は、3つのステップからなる反復アルゴリズムである。(1) グラフを再構成してホモフィリプロパティを復元し、(2) ラベルの伝搬を利用してノイズラベルを修正し、(3) 信頼度の高いラベルを選択して次のイテレーションに保持する。
論文 参考訳(メタデータ) (2023-10-25T11:28:26Z) - Learning on Graphs under Label Noise [5.909452203428086]
我々は,ラベルノイズのあるグラフ上での学習問題を解決するために,CGNN(Consistent Graph Neural Network)と呼ばれる新しいアプローチを開発した。
具体的には、グラフの対比学習を正規化用語として採用し、拡張ノードの2つのビューが一貫した表現を持つように促進する。
グラフ上の雑音ラベルを検出するために,ホモフィリー仮定に基づくサンプル選択手法を提案する。
論文 参考訳(メタデータ) (2023-06-14T01:38:01Z) - LiftPool: Lifting-based Graph Pooling for Hierarchical Graph
Representation Learning [53.176603566951016]
階層グラフ表現を改善するために,リフトプール (LiftPool) と呼ばれるリフトによる3段階法を提案する。
各ノードを削除するために、そのローカル情報は、隣接する保存ノードから集約されたグローバル情報を減らして得られる。
ベンチマークグラフデータセットの評価では、LiftPoolはグラフ分類のタスクにおいて最先端のグラフプーリング手法を大幅に上回っている。
論文 参考訳(メタデータ) (2022-04-27T12:38:02Z) - Graph Transplant: Node Saliency-Guided Graph Mixup with Local Structure
Preservation [27.215800308343322]
グラフトランスポート(Graph Transplant)と呼ばれるグラフレベルでMixupライクなグラフ拡張手法を提案する。
本手法では, 局所情報を保存可能な混合単位としてサブ構造を同定する。
複数のグラフ分類ベンチマークデータセットを用いて,多様なGNNアーキテクチャを用いて提案手法を広範囲に検証する。
論文 参考訳(メタデータ) (2021-11-10T11:10:13Z) - Label-Wise Message Passing Graph Neural Network on Heterophilic Graphs [20.470934944907608]
ホモフィリーあるいはヘテロフィリーなグラフでよく機能する新しいフレームワークについて検討する。
ラベルに関するメッセージパッシングでは、類似の擬似ラベルを持つ隣人が集約される。
また、ホモフィリー・ヘテロフィリーなグラフのモデルを自動的に選択するバイレベル最適化法を提案する。
論文 参考訳(メタデータ) (2021-10-15T14:49:45Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - GraphHop: An Enhanced Label Propagation Method for Node Classification [34.073791157290614]
GraphHopと呼ばれるスケーラブルな半監視ノード分類手法が提案されている。
実験結果は、GraphHopが幅広いタスクで最先端のグラフ学習方法より優れていることを示しています。
論文 参考訳(メタデータ) (2021-01-07T02:10:20Z) - Exploiting Heterogeneous Graph Neural Networks with Latent Worker/Task
Correlation Information for Label Aggregation in Crowdsourcing [72.34616482076572]
クラウドソーシングは専門家ではなく、専門家でない労働者からラベルを集めるのに便利であることから、多くの注目を集めている。
群集ラベルを集約するグラフニューラルネットワークに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:12:37Z) - Learn to Propagate Reliably on Noisy Affinity Graphs [69.97364913330989]
近年の研究では,ラベル伝搬によるラベル付きデータの利用により,ラベル付けコストを大幅に削減できることが示されている。
ラベルを確実に伝播する方法、特に未知の外れ値を持つデータセットでは、依然として未解決の問題である。
本稿では,大規模実世界のデータ上でラベルを確実に伝播させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-17T07:55:59Z) - Inverse Graph Identification: Can We Identify Node Labels Given Graph
Labels? [89.13567439679709]
グラフ識別(GI)は、グラフ学習において長い間研究されており、特定の応用において不可欠である。
本稿では,逆グラフ識別(Inverse Graph Identification, IGI)と呼ばれる新しい問題を定義する。
本稿では,グラフアテンションネットワーク(GAT)を用いたノードレベルのメッセージパッシング処理を,GIのプロトコルの下でシンプルかつ効果的に行う方法を提案する。
論文 参考訳(メタデータ) (2020-07-12T12:06:17Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。