論文の概要: A new approach for evaluating internal cluster validation indices
- arxiv url: http://arxiv.org/abs/2308.03894v1
- Date: Wed, 2 Aug 2023 06:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 00:27:51.287437
- Title: A new approach for evaluating internal cluster validation indices
- Title(参考訳): 内部クラスタ検証指標評価のための新しい手法
- Authors: Zolt\'an Botta-Duk\'at
- Abstract要約: クラスタ検証は、最高の性能のアルゴリズムを選択するために必要である。
追加情報(外部情報)を使わずに、この目的のためにいくつかの指標が提案された。
評価手法は, 地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A vast number of different methods are available for unsupervised
classification. Since no algorithm and parameter setting performs best in all
types of data, there is a need for cluster validation to select the actually
best-performing algorithm. Several indices were proposed for this purpose
without using any additional (external) information. These internal validation
indices can be evaluated by applying them to classifications of datasets with a
known cluster structure. Evaluation approaches differ in how they use the
information on the ground-truth classification. This paper reviews these
approaches, considering their advantages and disadvantages, and then suggests a
new approach.
- Abstract(参考訳): 教師なし分類には多数の異なる方法がある。
アルゴリズムやパラメータ設定はあらゆる種類のデータで最善を尽くさないため、実際に最適なアルゴリズムを選択するにはクラスタ検証が必要である。
この目的のために、追加の(外部の)情報を用いずにいくつかの指標が提案された。
これらの内部検証指標は、既知のクラスタ構造を持つデータセットの分類に適用することで評価することができる。
評価アプローチは、地上分類の情報の使い方によって異なる。
本稿では,これらのアプローチのメリットとデメリットを考慮し,新たなアプローチを提案する。
関連論文リスト
- ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - From A-to-Z Review of Clustering Validation Indices [4.08908337437878]
我々は、最も一般的なクラスタリングアルゴリズムを用いて、内部および外部クラスタリング検証指標の性能をレビューし、評価する。
内部クラスタリング検証と外部クラスタリング検証の両方の機能を調べるための分類フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-18T13:52:02Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - The Three Ensemble Clustering (3EC) Algorithm for Pattern Discovery in
Unsupervised Learning [1.0465883970481493]
3つのアンサンブルクラスタリング3EC」アルゴリズムは、教師なし学習の一部として、ラベルなしデータを品質クラスタに分類する。
各分割クラスタは、新しいデータセットと見なされ、最も最適なアルゴリズムを探索する候補である。
ユーザは、さまざまな停止基準を試すことができ、最も意味のあるグループの品質クラスタを選択することができる。
論文 参考訳(メタデータ) (2021-07-08T10:15:18Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - A New Validity Index for Fuzzy-Possibilistic C-Means Clustering [6.174448419090291]
Fuzzy-Possibilistic (FP)指数は、形状や密度の異なるクラスターの存在下でうまく機能する。
FPCMはファジィの度合いと典型性の度合いを事前選択する必要がある。
論文 参考訳(メタデータ) (2020-05-19T01:48:13Z) - A semi-supervised sparse K-Means algorithm [3.04585143845864]
クラスタリングに必要な機能のサブグループを検出するために、教師なしスパースクラスタリング手法を用いることができる。
半教師付き手法では、ラベル付きデータを使用して制約を作成し、クラスタリングソリューションを強化することができる。
提案アルゴリズムは,他の半教師付きアルゴリズムの高性能性を保ち,また,情報的特徴から情報的特徴を識別する能力も保持していることを示す。
論文 参考訳(メタデータ) (2020-03-16T02:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。