論文の概要: Anchor-free Clustering based on Anchor Graph Factorization
- arxiv url: http://arxiv.org/abs/2402.15688v1
- Date: Sat, 24 Feb 2024 02:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 17:32:16.756404
- Title: Anchor-free Clustering based on Anchor Graph Factorization
- Title(参考訳): アンカーグラフ因子化に基づくアンカーフリークラスタリング
- Authors: Shikun Mei, Fangfang Li, Quanxue Gao, Ming Yang
- Abstract要約: Anchor Graph Factorization(AFCAGF)に基づくAnchor-free Clusteringと呼ばれる新しい手法を提案する。
AFCAGFはアンカーグラフの学習において革新的であり、サンプル間のペア距離の計算のみを必要とする。
我々は,クラスタセンターとFKMのサンプル間のメンバシップ行列の概念を,複数のアンカーポイントとサンプルを含むアンカーグラフに進化させた。
- 参考スコア(独自算出の注目度): 18.809954521548303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anchor-based methods are a pivotal approach in handling clustering of
large-scale data. However, these methods typically entail two distinct stages:
selecting anchor points and constructing an anchor graph. This bifurcation,
along with the initialization of anchor points, significantly influences the
overall performance of the algorithm. To mitigate these issues, we introduce a
novel method termed Anchor-free Clustering based on Anchor Graph Factorization
(AFCAGF). AFCAGF innovates in learning the anchor graph, requiring only the
computation of pairwise distances between samples. This process, achievable
through straightforward optimization, circumvents the necessity for explicit
selection of anchor points. More concretely, our approach enhances the Fuzzy
k-means clustering algorithm (FKM), introducing a new manifold learning
technique that obviates the need for initializing cluster centers.
Additionally, we evolve the concept of the membership matrix between cluster
centers and samples in FKM into an anchor graph encompassing multiple anchor
points and samples. Employing Non-negative Matrix Factorization (NMF) on this
anchor graph allows for the direct derivation of cluster labels, thereby
eliminating the requirement for further post-processing steps. To solve the
method proposed, we implement an alternating optimization algorithm that
ensures convergence. Empirical evaluations on various real-world datasets
underscore the superior efficacy of our algorithm compared to traditional
approaches.
- Abstract(参考訳): アンカーベースの手法は、大規模データのクラスタリングを扱う上で重要なアプローチである。
しかし、これらの手法は通常、アンカー点の選択とアンカーグラフの構築という2つの異なる段階を含む。
この分岐は、アンカー点の初期化とともに、アルゴリズム全体の性能に大きな影響を及ぼす。
これらの問題を緩和するため,Anchor Graph Factorization (AFCAGF) に基づくアンカーフリークラスタリング手法を提案する。
AFCAGFはアンカーグラフの学習において革新的であり、サンプル間のペア距離の計算のみを必要とする。
このプロセスは単純最適化によって実現可能であり、アンカーポイントの明示的な選択の必要性を回避できる。
より具体的には、このアプローチはファジィk-meansクラスタリングアルゴリズム(fkm)を強化し、クラスタセンタの初期化の必要性を緩和する新しい多様体学習技術を導入する。
さらに、FKMにおけるクラスタセンターとサンプル間のメンバシップ行列の概念を、複数のアンカーポイントとサンプルを含むアンカーグラフに進化させる。
このアンカーグラフに非負行列分解(NMF)を用いることで、クラスタラベルの直接導出が可能となり、さらなる後処理ステップの必要がなくなる。
提案手法を解くために,収束を確実にする交互最適化アルゴリズムを実装した。
様々な実世界のデータセットにおける経験的評価は、従来の手法と比較してアルゴリズムの優れた効果を強調する。
関連論文リスト
- One-Step Multi-View Clustering Based on Transition Probability [61.841829428397034]
遷移確率に基づくワンステップマルチビュークラスタリング(OSMVC-TP)を導入する。
本手法は,アンカーポイントからカテゴリへの遷移確率を直接学習し,サンプルからカテゴリへの遷移確率を計算する。
異なる視点でラベルの整合性を維持するために、ソフトラベルからなるテンソルにシャッテン p-ノルムの制約を適用する。
論文 参考訳(メタデータ) (2024-03-03T09:43:23Z) - A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - Progressive Sub-Graph Clustering Algorithm for Semi-Supervised Domain
Adaptation Speaker Verification [17.284276598514502]
マルチモデル投票と二重ガウスに基づく評価に基づく新しいプログレッシブサブグラフクラスタリングアルゴリズムを提案する。
破滅的なクラスタリング結果を防止するため、段階的にkを増大させ、二重ガウスに基づく評価アルゴリズムを用いる反復的手法を採用する。
論文 参考訳(メタデータ) (2023-05-22T04:26:18Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Fast conformational clustering of extensive molecular dynamics
simulation data [19.444636864515726]
本稿では,長い軌道の高速なコンフォーメーションクラスタリングを実現するために,教師なしのデータ処理ワークフローを提案する。
我々は密度に基づく空間クラスタリングアルゴリズム(HDBSCAN)と2つの次元削減アルゴリズム(cc_analysisとEncodermap)を組み合わせる。
4つのテストシステムの助けを借りて、このクラスタリングワークフローの機能とパフォーマンスを説明します。
論文 参考訳(メタデータ) (2023-01-11T14:36:43Z) - DeepCut: Unsupervised Segmentation using Graph Neural Networks
Clustering [6.447863458841379]
本研究では,従来のクラスタリング手法を置き換える軽量グラフニューラルネットワーク(GNN)を提案する。
既存の手法とは異なり、GNNはローカル画像特徴と生特徴とのペアワイズ親和性の両方を入力として取ります。
画像セグメンテーションGNNを訓練するための自己教師付き損失関数として,古典的クラスタリングの目的を定式化する方法を実証する。
論文 参考訳(メタデータ) (2022-12-12T12:31:46Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Determinantal consensus clustering [77.34726150561087]
本稿では,クラスタリングアルゴリズムのランダム再起動における決定点プロセス (DPP) の利用を提案する。
DPPは部分集合内の中心点の多様性を好んでいる。
DPPとは対照的に、この手法は多様性の確保と、すべてのデータフェースについて良好なカバレッジを得るために失敗することを示す。
論文 参考訳(メタデータ) (2021-02-07T23:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。