論文の概要: A Bayesian cluster validity index
- arxiv url: http://arxiv.org/abs/2402.02162v1
- Date: Sat, 3 Feb 2024 14:23:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 21:36:19.536586
- Title: A Bayesian cluster validity index
- Title(参考訳): ベイズクラスタの妥当性指数
- Authors: Nathakhun Wiroonsri and Onthada Preedasawakul
- Abstract要約: 既存の指標に基づくベイズクラスタ妥当性指数(BCVI)を導入する。
BCVIはWiroonsri index(WI)とWiroonsri-Preedasawakul index(WP)に基づいてテストされている。
提案したBCVIは,最終的なクラスタ数の予測範囲をユーザが指定可能な場合に,CVIの使用に有効である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selecting the number of clusters is one of the key processes when applying
clustering algorithms. To fulfill this task, various cluster validity indices
(CVIs) have been introduced. Most of the cluster validity indices are defined
to detect the optimal number of clusters hidden in a dataset. However, users
sometimes do not expect to get the optimal number of groups but a secondary one
which is more reasonable for their applications. This has motivated us to
introduce a Bayesian cluster validity index (BCVI) based on existing underlying
indices. This index is defined based on either Dirichlet or Generalized
Dirichlet priors which result in the same posterior distribution. Our BCVI is
then tested based on the Wiroonsri index (WI), and the Wiroonsri-Preedasawakul
index (WP) as underlying indices for hard and soft clustering, respectively. We
compare their outcomes with the original underlying indices, as well as a few
more existing CVIs including Davies and Bouldin (DB), Starczewski (STR), Xie
and Beni (XB), and KWON2 indices. Our proposed BCVI clearly benefits the use of
CVIs when experiences matter where users can specify their expected range of
the final number of clusters. This aspect is emphasized by our experiment
classified into three different cases. Finally, we present some applications to
real-world datasets including MRI brain tumor images. Our tools will be added
to a new version of the recently developed R package ``UniversalCVI''.
- Abstract(参考訳): クラスタ数を選択することは、クラスタリングアルゴリズムを適用する際の重要なプロセスのひとつです。
この課題を達成するために、様々なクラスタ妥当性指標(CVI)が導入された。
クラスタの妥当性指標の多くは、データセットに隠されたクラスタの最適な数を検出するために定義される。
しかし、ユーザは最適な数のグループを期待しない場合もあるが、アプリケーションにとってより合理的なセカンダリなグループがある。
これは既存のインデックスに基づいてベイズクラスタ妥当性指数(bcvi)を導入する動機となった。
この指数はdirichletまたはgeneralized dirichlet priorのいずれかに基づいて定義され、結果として同じ後方分布になる。
BCVIはWiroonsri index(WI)とWiroonsri-Preedasawakul index(WP)に基づいて,それぞれハードクラスタリングとソフトクラスタリングの基礎となる指標としてテストされる。
それらの結果と、元のインデックスと、davies と bouldin (db)、starczewski (str)、xie and beni (xb)、kwon2 インデックスを含むいくつかの既存のcvisを比較した。
提案したBCVIは,最終的なクラスタ数の予測範囲をユーザが指定可能な場合に,CVIの使用に有効である。
この側面は、実験によって3つの異なるケースに分類される。
最後に、MRI脳腫瘍画像を含む実世界のデータセットに適用する。
私たちのツールは、最近開発されたRパッケージ ``UniversalCVI'' の新バージョンに追加されます。
関連論文リスト
- ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence [97.93517982908007]
NCCは、ドメイン間数ショットの分類において、少数ショットの分類が可能なメートル法空間を構築するために表現を学ぶことを目的としている。
本稿では,異なるクラスから得られた2つの標本の NCC 学習表現に高い類似性があることを見出した。
ラベル付きデータによって示されるクラスタ構造にマッチするクラス固有の表現の集合を学習するために、最適化されたカーネル依存(MOKD)を最大化する二段階最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T05:59:52Z) - On the Use of Relative Validity Indices for Comparing Clustering Approaches [0.6990493129893111]
相対妥当性指標はクラスタリング結果の評価と最適化に広く用いられている。
クラスタリングのための類似パラダイム(SP)を選択する際に、RVIを使う文献が増えつつある。
本研究では,SP選択のためのRVIの信頼性に関する総合的研究を行った。
論文 参考訳(メタデータ) (2024-04-16T07:39:54Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - A correlation-based fuzzy cluster validity index with secondary options
detector [0.0]
本稿では,Wiroonsri-Preedasawakul(WP)インデックスとして知られる相関に基づくファジィクラスタの妥当性指標を提案する。
我々は,Xie-Beni,Pakhira-Bandyopadhyay-Maulik,Tang,Wu-Li,Generalized C,Kwon2などの既存指標と比較した。
論文 参考訳(メタデータ) (2023-08-28T16:40:34Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - A novel cluster internal evaluation index based on hyper-balls [11.048887848164268]
クラスタ分析において、品質を評価し、最適なクラスタ数を決定することが重要である。
本稿では,データセットの多粒度特徴付けを行い,ハイパーボールを得る。
ハイパーボール(HCVI)に基づくクラスタ内部評価指標を定義する。
論文 参考訳(メタデータ) (2022-12-30T02:56:40Z) - Are Cluster Validity Measures (In)valid? [3.7491936479803054]
本稿では、教師なし学習活動において、このような指標を客観的機能として扱うとどうなるかを検討する。
多くのクラスタ(無効度指数)が、専門家の知識にマッチするクラスタリングを促進することが判明した。
我々は、OWA演算子と近辺グラフ上に構築されたダン指数の、より優れた新しい変種を導入する。
論文 参考訳(メタデータ) (2022-08-02T06:08:48Z) - Implicit Sample Extension for Unsupervised Person Re-Identification [97.46045935897608]
クラスタリングは、時に異なる真のアイデンティティを混ぜ合わせたり、同じアイデンティティを2つ以上のサブクラスタに分割する。
本稿では,クラスタ境界周辺のサポートサンプルを生成するために,Implicit Sample Extension (OurWholeMethod)法を提案する。
提案手法の有効性を実証し,教師なしのRe-IDに対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-04-14T11:41:48Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Clustering performance analysis using new correlation based cluster
validity indices [0.0]
本研究では,2つのデータポイント間の実際の距離と,2つのポイントが位置するクラスタのセントロイド距離との相関に基づく2つの新しいクラスタ妥当性指標を開発した。
提案した指標は, 前述した弱点を克服する異なる数のクラスタにおいて, 常にいくつかのピークを発生させる。
論文 参考訳(メタデータ) (2021-09-23T06:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。