論文の概要: Learnable Similarity and Dissimilarity Guided Symmetric Non-Negative Matrix Factorization
- arxiv url: http://arxiv.org/abs/2412.04082v1
- Date: Thu, 05 Dec 2024 11:32:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-06 14:40:01.600344
- Title: Learnable Similarity and Dissimilarity Guided Symmetric Non-Negative Matrix Factorization
- Title(参考訳): 対称的非負行列因子化による学習可能な類似性と相似性
- Authors: Wenlong Lyu, Yuheng Jia,
- Abstract要約: 学習可能な重み付き$k$-NNグラフを構築し、各$k$-th NNの信頼性を反映する。
識別的類似度行列を得るために,類似度行列の二重構造を持つ相似性行列を導入する。
提案したモデルを解決するために,効率的な代替最適化アルゴリズムを設計する。
- 参考スコア(独自算出の注目度): 18.53944578996308
- License:
- Abstract: Symmetric nonnegative matrix factorization (SymNMF) is a powerful tool for clustering, which typically uses the $k$-nearest neighbor ($k$-NN) method to construct similarity matrix. However, $k$-NN may mislead clustering since the neighbors may belong to different clusters, and its reliability generally decreases as $k$ grows. In this paper, we construct the similarity matrix as a weighted $k$-NN graph with learnable weight that reflects the reliability of each $k$-th NN. This approach reduces the search space of the similarity matrix learning to $n - 1$ dimension, as opposed to the $\mathcal{O}(n^2)$ dimension of existing methods, where $n$ represents the number of samples. Moreover, to obtain a discriminative similarity matrix, we introduce a dissimilarity matrix with a dual structure of the similarity matrix, and propose a new form of orthogonality regularization with discussions on its geometric interpretation and numerical stability. An efficient alternative optimization algorithm is designed to solve the proposed model, with theoretically guarantee that the variables converge to a stationary point that satisfies the KKT conditions. The advantage of the proposed model is demonstrated by the comparison with nine state-of-the-art clustering methods on eight datasets. The code is available at \url{https://github.com/lwl-learning/LSDGSymNMF}.
- Abstract(参考訳): 対称的非負行列分解(SymNMF)はクラスタリングの強力なツールであり、典型的には類似行列を構成するために$k$-nearest neighbor$k$-NN)法を用いる。
しかし、$k$-NNは、隣人が異なるクラスタに属している可能性があるため、クラスタリングを誤解させる可能性がある。
本稿では,類似度行列を学習可能な重み付き$k$-NNグラフとして構築し,各$k$-th NNの信頼性を反映する。
このアプローチは、類似行列学習の探索空間を $n - 1$ dimension に減らし、既存のメソッドの $\mathcal{O}(n^2)$ dimension とは対照的に、$n$ はサンプル数を表す。
さらに、識別的類似度行列を得るために、類似度行列の二重構造を持つ相似性行列を導入し、その幾何学的解釈と数値的安定性を議論した新しい直交正則化法を提案する。
KKT条件を満たす定常点に変数が収束することを理論的に保証する、効率的な代替最適化アルゴリズムが提案される。
提案モデルの利点は、8つのデータセット上の9つの最先端クラスタリング手法との比較によって示される。
コードは \url{https://github.com/lwl-learning/LSDGSymNMF} で公開されている。
関連論文リスト
- A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Semi-supervised Symmetric Non-negative Matrix Factorization with Low-Rank Tensor Representation [27.14442336413482]
半教師付き対称非負行列分解(SNMF)
対制約行列により合成されたテンソルの低ランク表現を求めるSNMFモデルを提案する。
次に、拡張SNMFモデルを提案し、埋め込み行列を上記のテンソル低ランク表現に適合させる。
論文 参考訳(メタデータ) (2024-05-04T14:58:47Z) - Replicable Clustering [57.19013971737493]
我々は,統計学的な$k$-medians,統計学的な$k$-means,統計学的な$k$-centers問題のアルゴリズムをブラックボックス方式で近似ルーチンを用いて提案する。
理論的結果を検証するブラックボックスとしてsklearnの$k$-means++実装を用いた2次元合成分布の実験も行っている。
論文 参考訳(メタデータ) (2023-02-20T23:29:43Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Optimal Variable Clustering for High-Dimensional Matrix Valued Data [3.1138411427556445]
本稿では,行列形式で配置された特徴に対して,新しい潜在変数モデルを提案する。
軽度条件下では,高次元設定でクラスタリングの整合性が得られる。
この重みを使用すれば、アルゴリズムが最小値の速度最適化であることが保証されるという意味で、最適な重みを識別する。
論文 参考訳(メタデータ) (2021-12-24T02:13:04Z) - Sublinear Time Approximation of Text Similarity Matrices [50.73398637380375]
一般的なNystr"om法を不確定な設定に一般化する。
我々のアルゴリズムは任意の類似性行列に適用でき、行列のサイズでサブ線形時間で実行される。
本手法は,CUR分解の単純な変種とともに,様々な類似性行列の近似において非常によく機能することを示す。
論文 参考訳(メタデータ) (2021-12-17T17:04:34Z) - Optimal N-ary ECOC Matrices for Ensemble Classification [1.3561997774592662]
アンサンブル分類法における誤り訂正出力符号(ECOC)の新たな構成について述べる。
任意の素数$N$が与えられたとき、この決定論的構成は基底-$N$対称二乗行列を$M$で生成する。
論文 参考訳(メタデータ) (2021-10-05T16:50:15Z) - Self-supervised Symmetric Nonnegative Matrix Factorization [82.59905231819685]
シンメトリー非負係数行列(SNMF)は、データクラスタリングの強力な方法であることを示した。
より良いクラスタリング結果を求めるアンサンブルクラスタリングにインスパイアされた,自己監視型SNMF(S$3$NMF)を提案する。
SNMFのコード特性に対する感度を、追加情報に頼らずに活用しています。
論文 参考訳(メタデータ) (2021-03-02T12:47:40Z) - Stochastic Flows and Geometric Optimization on the Orthogonal Group [52.50121190744979]
直交群 $O(d)$ 上の幾何駆動最適化アルゴリズムの新しいクラスを示す。
提案手法は,深層,畳み込み,反復的なニューラルネットワーク,強化学習,フロー,メトリック学習など,機械学習のさまざまな分野に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-03-30T15:37:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。