論文の概要: FedSpectral+: Spectral Clustering using Federated Learning
- arxiv url: http://arxiv.org/abs/2302.02137v1
- Date: Sat, 4 Feb 2023 09:28:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 19:55:33.528999
- Title: FedSpectral+: Spectral Clustering using Federated Learning
- Title(参考訳): FedSpectral+:Federated Learningを用いたスペクトルクラスタリング
- Authors: Janvi Thakkar, Devvrat Joshi
- Abstract要約: 本稿では,データプライバシの問題と通信コストの増大を克服するために,FLを用いたスペクトルクラスタリングアルゴリズムを提案する。
FLは、ユーザの生データを収集するのではなく、各学習者のモデルパラメータを蓄積するプライバシー保護アルゴリズムである。
FedSpectralは、局所スペクトルクラスタリングラベルを使用して、類似性グラフを作成することで、グローバルスペクトルクラスタリングを集約するベースラインアプローチである。
最先端のアプローチであるFedSpectral+は、クライアント間で分散された生の情報にアクセスすることなく、グラフデータ全体を組み込むことで、グローバルなスペクトル埋め込みを学習するためにパワーメソッドを使用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering in graphs has been a well-known research problem, particularly
because most Internet and social network data is in the form of graphs.
Organizations widely use spectral clustering algorithms to find clustering in
graph datasets. However, applying spectral clustering to a large dataset is
challenging due to computational overhead. While the distributed spectral
clustering algorithm exists, they face the problem of data privacy and
increased communication costs between the clients. Thus, in this paper, we
propose a spectral clustering algorithm using federated learning (FL) to
overcome these issues. FL is a privacy-protecting algorithm that accumulates
model parameters from each local learner rather than collecting users' raw
data, thus providing both scalability and data privacy. We developed two
approaches: FedSpectral and FedSpectral+. FedSpectral is a baseline approach
that uses local spectral clustering labels to aggregate the global spectral
clustering by creating a similarity graph. FedSpectral+, a state-of-the-art
approach, uses the power iteration method to learn the global spectral
embedding by incorporating the entire graph data without access to the raw
information distributed among the clients. We further designed our own
similarity metric to check the clustering quality of the distributed approach
to that of the original/non-FL clustering. The proposed approach FedSpectral+
obtained a similarity of 98.85% and 99.8%, comparable to that of global
clustering on the ego-Facebook and email-Eu-core dataset.
- Abstract(参考訳): グラフのクラスタリングはよく知られた研究問題であり、特にインターネットやソーシャルネットワークのデータのほとんどはグラフの形式である。
組織は、グラフデータセットのクラスタリングを見つけるために、スペクトルクラスタリングアルゴリズムを広く使っている。
しかし、スペクトルクラスタリングを大規模データセットに適用することは、計算オーバーヘッドのため困難である。
分散スペクトルクラスタリングアルゴリズムは存在するが、データプライバシとクライアント間の通信コストの増大という問題に直面している。
そこで本稿では,これらの問題を克服するために,フェデレートラーニング(FL)を用いたスペクトルクラスタリングアルゴリズムを提案する。
FLは、ユーザの生データを収集するのではなく、各学習者のモデルパラメータを蓄積し、スケーラビリティとデータのプライバシを提供するプライバシー保護アルゴリズムである。
我々はFedSpectralとFedSpectral+の2つのアプローチを開発した。
FedSpectralは、局所スペクトルクラスタリングラベルを使用して、類似性グラフを作成することで、グローバルスペクトルクラスタリングを集約するベースラインアプローチである。
最先端のアプローチであるfeedspectral+は、power iterationメソッドを使用して、クライアント間で分散された生情報にアクセスせずにグラフデータ全体を組み込むことで、グローバルスペクトル埋め込みを学ぶ。
さらに,分散アプローチのクラスタリング品質をオリジナル/非flクラスタリングと比較するために,独自の類似度指標を設計した。
提案手法であるfeedspectral+は98.85%と99.8%の類似性を持ち、ego-facebookとeメール-eu-coreデータセットのグローバルクラスタリングに匹敵する。
関連論文リスト
- A Comprehensive Survey on Spectral Clustering with Graph Structure Learning [10.579153358536372]
スペクトルクラスタリングは、高次元データをクラスタリングするための強力な技術である。
グラフクラスタリング手法として,ペアワイズ,アンカー,ハイパーグラフに基づく手法について検討する。
マルチビュークラスタリングフレームワークについて論じ,アプリケーションを1段階,2段階のクラスタリングプロセスで検証する。
論文 参考訳(メタデータ) (2025-01-23T12:06:32Z) - Federated Incomplete Multi-View Clustering with Heterogeneous Graph Neural Networks [21.710283538891968]
フェデレートされたマルチビュークラスタリングは、複数のデバイスに分散したデータを使用したグローバルクラスタリングモデルを開発する可能性を提供する。
現在の手法は、ラベル情報がないことと、データプライバシの重要性が最重要視されているため、課題に直面している。
ヘテロジニアスグラフニューラルネットワーク(FIM-GNN)を用いたフェデレーション不完全なマルチビュークラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:16:00Z) - A Unified Framework for Fair Spectral Clustering With Effective Graph
Learning [12.343382413705394]
群フェアネス制約下でのスペクトルクラスタリングの問題点を考察する。
実際には、グラフは通常不明であり、潜在的にノイズの多いデータから基盤となるグラフを構築する必要がある。
雑音データからグラフを学習するためのノード適応グラフフィルタを用いた新しいグラフ構築法を提案する。
論文 参考訳(メタデータ) (2023-11-23T01:43:00Z) - Dynamically Weighted Federated k-Means [0.0]
フェデレートされたクラスタリングにより、複数のデータソースが協力してデータをクラスタリングし、分散化とプライバシ保護を維持できる。
我々は,ロイドのk-meansクラスタリング法に基づいて,動的に重み付けされたk-means (DWF k-means) という新しいクラスタリングアルゴリズムを提案する。
我々は、クラスタリングスコア、精度、およびv尺度の観点から、アルゴリズムの性能を評価するために、複数のデータセットとデータ分散設定の実験を行う。
論文 参考訳(メタデータ) (2023-10-23T12:28:21Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - GLCC: A General Framework for Graph-level Clustering [5.069852282550117]
本稿では,グラフレベルのクラスタリングの問題について検討する。
GLCC(Graph-Level Contrastive Clustering)というグラフレベルの一般的なクラスタリングフレームワークを提案する。
様々なよく知られたデータセットに対する実験は、競合するベースラインよりも提案したGLCCの方が優れていることを示す。
論文 参考訳(メタデータ) (2022-10-21T11:08:10Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Spectral-Spatial Global Graph Reasoning for Hyperspectral Image
Classification [50.899576891296235]
畳み込みニューラルネットワークは、ハイパースペクトル画像分類に広く応用されている。
近年の手法は空間トポロジのグラフ畳み込みによってこの問題に対処しようとしている。
論文 参考訳(メタデータ) (2021-06-26T06:24:51Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。