論文の概要: A new nonparametric interpoint distance-based measure for assessment of
clustering
- arxiv url: http://arxiv.org/abs/2210.08972v1
- Date: Sat, 1 Oct 2022 04:27:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 20:44:55.111487
- Title: A new nonparametric interpoint distance-based measure for assessment of
clustering
- Title(参考訳): クラスタリング評価のための非パラメータ間距離に基づく新しい尺度
- Authors: Soumita Modak
- Abstract要約: データセットに存在するクラスタの最適な数を特定するために,新たなインターポイント距離に基づく測度を提案する。
提案する基準は任意のクラスタリングアルゴリズムと互換性があり,未知数のクラスタを決定するために使用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A new interpoint distance-based measure is proposed to identify the optimal
number of clusters present in a data set. Designed in nonparametric approach,
it is independent of the distribution of given data. Interpoint distances
between the data members make our cluster validity index applicable to
univariate and multivariate data measured on arbitrary scales, or having
observations in any dimensional space where the number of study variables can
be even larger than the sample size. Our proposed criterion is compatible with
any clustering algorithm, and can be used to determine the unknown number of
clusters or to assess the quality of the resulting clusters for a data set.
Demonstration through synthetic and real-life data establishes its superiority
over the well-known clustering accuracy measures of the literature.
- Abstract(参考訳): データセットに存在するクラスタの最適な数を特定するために,新たなインターポイント距離に基づく測度を提案する。
非パラメトリックな方法で設計され、与えられたデータの分布とは独立している。
データメンバー間の点間距離は、任意のスケールで測定された不等変量および多変量データに適用可能か、または研究変数の数がサンプルサイズよりさらに大きい任意の次元空間で観測可能となる。
提案する基準は任意のクラスタリングアルゴリズムと互換性があり,未知のクラスタ数の決定や,データセットのクラスタの品質評価に利用することができる。
合成および実生活データによる実証は、文献のよく知られたクラスタリング精度尺度よりも優れている。
関連論文リスト
- Interpretable Clustering with the Distinguishability Criterion [0.4419843514606336]
本稿では,特定クラスタの分離可能性の定量化と推定クラスタ構成の検証を行うために,分散可能性基準と呼ばれるグローバルな基準を提案する。
本稿では、分散可能性基準と多くの一般的なクラスタリング手順を統合した損失関数に基づく計算フレームワークを提案する。
シミュレーション研究および実データアプリケーションに基づく包括的データ解析の結果とともに,これらの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-24T16:38:15Z) - Superclustering by finding statistically significant separable groups of
optimal gaussian clusters [0.0]
本稿では,BIC基準の観点から,最適なデータセットをグループ化することで,データセットをクラスタリングするアルゴリズムを提案する。
このアルゴリズムの重要な利点は、既に訓練済みのクラスタに基づいて、新しいデータの正しいスーパークラスタを予測する能力である。
論文 参考訳(メタデータ) (2023-09-05T23:49:46Z) - Mixed-type Distance Shrinkage and Selection for Clustering via Kernel Metric Learning [0.0]
我々は、混合カーネルを用いて異種性を測定するKDSUMと呼ばれる計量を提案する。
我々は、KDSUMが既存の混合型メトリクスから均一な異性度メトリクスへの縮小法であることを実証した。
論文 参考訳(メタデータ) (2023-06-02T19:51:48Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Clustering performance analysis using new correlation based cluster
validity indices [0.0]
本研究では,2つのデータポイント間の実際の距離と,2つのポイントが位置するクラスタのセントロイド距離との相関に基づく2つの新しいクラスタ妥当性指標を開発した。
提案した指標は, 前述した弱点を克服する異なる数のクラスタにおいて, 常にいくつかのピークを発生させる。
論文 参考訳(メタデータ) (2021-09-23T06:59:41Z) - Local versions of sum-of-norms clustering [77.34726150561087]
本手法はボールモデルにおいて任意に閉じた球を分離できることを示す。
我々は、不連結連結集合のクラスタリングで発生する誤差に定量的な有界性を証明した。
論文 参考訳(メタデータ) (2021-09-20T14:45:29Z) - The Exploitation of Distance Distributions for Clustering [3.42658286826597]
クラスタ分析では、距離分布の異なる特性が適切な距離選択に関係していると判断される。
ミラー化密度プロットを用いて分布解析を用いて,この仕様を体系的に検討することにより,クラスタ解析においてマルチモーダル距離分布が好ましいことを示す。
実験は、クラスタリングのタスクのために、いくつかの人工データセットと自然なデータセットで行われます。
論文 参考訳(メタデータ) (2021-08-22T06:22:08Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。