論文の概要: Community Detection Using Revised Medoid-Shift Based on KNN
- arxiv url: http://arxiv.org/abs/2304.09512v1
- Date: Wed, 19 Apr 2023 09:02:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 15:10:50.570425
- Title: Community Detection Using Revised Medoid-Shift Based on KNN
- Title(参考訳): KNNに基づく修正メドイドシフトを用いたコミュニティ検出
- Authors: Jie Hou, Jiakang Li, Xiaokang Peng, Wei Ke, Yonggang Lu
- Abstract要約: コミュニティ検出は、ソーシャルネットワークのブームにとって重要な問題である。
平均シフトはコミュニティ検出に直接適用できない。
Medoid-Shiftと呼ばれる新しいクラスタリングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 11.503324011020858
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Community detection becomes an important problem with the booming of social
networks. As an excellent clustering algorithm, Mean-Shift can not be applied
directly to community detection, since Mean-Shift can only handle data with
coordinates, while the data in the community detection problem is mostly
represented by a graph that can be treated as data with a distance matrix (or
similarity matrix). Fortunately, a new clustering algorithm called Medoid-Shift
is proposed. The Medoid-Shift algorithm preserves the benefits of Mean-Shift
and can be applied to problems based on distance matrix, such as community
detection. One drawback of the Medoid-Shift algorithm is that there may be no
data points within the neighborhood region defined by a distance parameter. To
deal with the community detection problem better, a new algorithm called
Revised Medoid-Shift (RMS) in this work is thus proposed. During the process of
finding the next medoid, the RMS algorithm is based on a neighborhood defined
by KNN, while the original Medoid-Shift is based on a neighborhood defined by a
distance parameter. Since the neighborhood defined by KNN is more stable than
the one defined by the distance parameter in terms of the number of data points
within the neighborhood, the RMS algorithm may converge more smoothly. In the
RMS method, each of the data points is shifted towards a medoid within the
neighborhood defined by KNN. After the iterative process of shifting, each of
the data point converges into a cluster center, and the data points converging
into the same center are grouped into the same cluster.
- Abstract(参考訳): コミュニティ検出は、ソーシャルネットワークのブームにおいて重要な問題となる。
平均シフトは座標付きデータしか扱えないが、コミュニティ検出問題のデータは距離行列(または類似行列)を持つデータとして扱うことができるグラフで表されるため、優れたクラスタリングアルゴリズムとして、平均シフトはコミュニティ検出に直接適用できない。
幸いにもmedoid-shiftと呼ばれる新しいクラスタリングアルゴリズムが提案されている。
Medoid-Shiftアルゴリズムは平均シフトの利点を保ち、コミュニティ検出のような距離行列に基づく問題に適用できる。
メドイドシフトアルゴリズムの欠点の1つは、距離パラメータによって定義される近傍領域にデータポイントが存在しないことである。
そこで本研究では, コミュニティ検出問題をよりよく扱うために, 改良型メドロイドシフト (rms) と呼ばれる新しいアルゴリズムを提案する。
次のメドイドを見つける過程において、RMSアルゴリズムはKNNで定義された近傍に基づいており、元のメドイドシフトは距離パラメータで定義された近傍に基づいている。
knnによって定義される近傍は、近傍内のデータポイント数の観点から距離パラメータによって定義される近傍よりも安定であるため、rmsアルゴリズムはよりスムーズに収束することができる。
RMS法では、各データポイントは、KNNで定義された近傍のメドロイドに移動される。
反復的なシフト処理の後、各データポイントがクラスタセンタに収束し、同じセンタに集約されたデータポイントが同じクラスタにグループ化される。
関連論文リスト
- Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - DenMune: Density peak based clustering using mutual nearest neighbors [0.0]
多くのクラスタリングアルゴリズムは、クラスタが任意の形状、様々な密度、あるいはデータクラスが互いに不均衡で近接している場合に失敗する。
この課題を満たすために、新しいクラスタリングアルゴリズムであるDenMuneが提示されている。
これは、Kがユーザから要求される唯一のパラメータである大きさKの互いに近い近傍を用いて、密集領域を特定することに基づいている。
論文 参考訳(メタデータ) (2023-09-23T16:18:00Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - An Improved Probability Propagation Algorithm for Density Peak
Clustering Based on Natural Nearest Neighborhood [0.0]
高速探索と密度ピーク(DPC)の探索によるクラスタリングは,有望なクラスタリング手法であることが証明されている。
本稿では,DPC-PPNNNに基づく密度ピーククラスタリングのための改良された確率伝搬アルゴリズムを提案する。
いくつかのデータセットの実験では、DPC-PPNNNはDPC、K-means、DBSCANを上回っている。
論文 参考訳(メタデータ) (2022-07-04T03:36:57Z) - A density peaks clustering algorithm with sparse search and K-d tree [16.141611031128427]
この問題を解決するために,スパース探索とK-d木を用いた密度ピーククラスタリングアルゴリズムを開発した。
分散特性が異なるデータセット上で、他の5つの典型的なクラスタリングアルゴリズムと比較して実験を行う。
論文 参考訳(メタデータ) (2022-03-02T09:29:40Z) - Escaping Saddle Points with Bias-Variance Reduced Local Perturbed SGD
for Communication Efficient Nonconvex Distributed Learning [58.79085525115987]
ローカル手法は通信時間を短縮する有望なアプローチの1つである。
局所的データセットが局所的損失の滑らかさよりも小さい場合,通信の複雑さは非局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-12T15:12:17Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - LSG-CPD: Coherent Point Drift with Local Surface Geometry for Point
Cloud Registration [1.8876415010297891]
剛点雲登録のための局所表面形状法 (LSG-CPD) を用いた CPD と呼ばれる新しい手法を提案する。
本手法は,局所表面の平坦度に基づいて,点対面のペナリゼーションに異なるレベルのペナリゼーションを適応的に付加する。
CPDの現代の実装よりもはるかに高速です。
論文 参考訳(メタデータ) (2021-03-28T03:46:41Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - FedPD: A Federated Learning Framework with Optimal Rates and Adaptivity
to Non-IID Data [59.50904660420082]
フェデレートラーニング(FL)は、分散データから学ぶための一般的なパラダイムになっています。
クラウドに移行することなく、さまざまなデバイスのデータを効果的に活用するために、Federated Averaging(FedAvg)などのアルゴリズムでは、"Computation then aggregate"(CTA)モデルを採用している。
論文 参考訳(メタデータ) (2020-05-22T23:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。