論文の概要: Solving clustering as ill-posed problem: experiments with K-Means
algorithm
- arxiv url: http://arxiv.org/abs/2211.08302v1
- Date: Tue, 15 Nov 2022 17:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 14:10:25.119624
- Title: Solving clustering as ill-posed problem: experiments with K-Means
algorithm
- Title(参考訳): クラスタリングを誤った問題として解く:K-Meansアルゴリズムによる実験
- Authors: Alberto Arturo Vergani
- Abstract要約: K-Meansアルゴリズムに基づくクラスタリング手法を逆問題として検討した。
クラスタリング逆問題ドライブの品質向上の試みにより,主成分分析による入力データ削減が図られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this contribution, the clustering procedure based on K-Means algorithm is
studied as an inverse problem, which is a special case of the illposed
problems. The attempts to improve the quality of the clustering inverse problem
drive to reduce the input data via Principal Component Analysis (PCA). Since
there exists a theorem by Ding and He that links the cardinality of the optimal
clusters found with K-Means and the cardinality of the selected informative PCA
components, the computational experiments tested the theorem between two
quantitative features selection methods: Kaiser criteria (based on imperative
decision) versus Wishart criteria (based on random matrix theory). The results
suggested that PCA reduction with features selection by Wishart criteria leads
to a low matrix condition number and satisfies the relation between clusters
and components predicts by the theorem. The data used for the computations are
from a neuroscientific repository: it regards healthy and young subjects that
performed a task-oriented functional Magnetic Resonance Imaging (fMRI)
paradigm.
- Abstract(参考訳): このコントリビューションにおいて、K-Meansアルゴリズムに基づくクラスタリング手順は逆問題として研究され、これは不備な問題の特別な場合である。
クラスタリング逆問題の品質を向上させるために,主成分分析 (pca) による入力データを削減する。
Ding と He の定理は K-Means で見つかった最適クラスターの濃度と選択された情報的 PCA 成分の濃度を結びつけるものであるので、計算実験は2つの量的特徴選択法:カイザー基準(命令的決定に基づく)とウィッシュアート基準(ランダム行列理論に基づく)の定理を検証した。
結果は,Wishartの基準による特徴選択によるPCA削減は,行列条件数が少なく,定理によって予測されるクラスタとコンポーネントの関係を満たすことを示唆した。
計算に使用されるデータは神経科学のリポジトリからであり、タスク指向の機能的磁気共鳴イメージング(fMRI)パラダイムを実行した健常者や若年者を対象としている。
関連論文リスト
- Hierarchical and Density-based Causal Clustering [6.082022112101251]
本稿では,既成のアルゴリズムを用いて簡易かつ容易に実装可能なプラグイン推定器を提案する。
さらに,それらの収束率について検討し,因果クラスタリングの付加コストが基本的に結果回帰関数の推定誤差であることを示す。
論文 参考訳(メタデータ) (2024-11-02T14:01:04Z) - A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.12938977698988]
Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T07:24:11Z) - Multiple kernel concept factorization algorithm based on global fusion [9.931283387968856]
教師なし環境では、特定のデータセットに対して適切なカーネル関数を設計または選択するために、Globalized Multiple Kernel(GMKCF)と呼ばれる新しいアルゴリズムが提案された。
提案アルゴリズムは,Kernel K-Means(KKM), Spectral Clustering(SC), CF Kernel(KCF), Co-regularized Multi-view spectrum clustering(Coreg), Robust Multiple KKM(RMKKM)などのデータクラスタリングにおける比較アルゴリズムより優れている。
論文 参考訳(メタデータ) (2024-10-27T09:13:57Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Multi-Prototypes Convex Merging Based K-Means Clustering Algorithm [20.341309224377866]
マルチプロトタイプの凸マージに基づくK-Meansクラスタリングアルゴリズム(MCKM)を提案する。
MCKM は K-Means 問題の望ましくない局所最小値から k を優先せずに逃れるための効率的で説明可能なクラスタリングアルゴリズムである。
論文 参考訳(メタデータ) (2023-02-14T13:57:33Z) - On the Global Solution of Soft k-Means [159.23423824953412]
本稿では,ソフトk-平均問題の解法を全世界で提案する。
ミニマルボリュームソフトkMeans (MVSkM) と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-12-07T12:06:55Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - A New Validity Index for Fuzzy-Possibilistic C-Means Clustering [6.174448419090291]
Fuzzy-Possibilistic (FP)指数は、形状や密度の異なるクラスターの存在下でうまく機能する。
FPCMはファジィの度合いと典型性の度合いを事前選択する必要がある。
論文 参考訳(メタデータ) (2020-05-19T01:48:13Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。