論文の概要: A Bayesian cluster validity index
- arxiv url: http://arxiv.org/abs/2402.02162v2
- Date: Wed, 14 Feb 2024 14:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 18:33:12.890174
- Title: A Bayesian cluster validity index
- Title(参考訳): ベイズクラスタの妥当性指数
- Authors: Nathakhun Wiroonsri and Onthada Preedasawakul
- Abstract要約: クラスタ妥当性指標(CVI)は、データセット内のクラスタの最適な数を特定するように設計されている。
既存の指標に基づくベイズクラスタ妥当性指数(BCVI)を導入する。
私たちのBCVIは、ユーザの専門知識が価値のある状況において明確なアドバンテージを提供しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selecting the appropriate number of clusters is a critical step in applying
clustering algorithms. To assist in this process, various cluster validity
indices (CVIs) have been developed. These indices are designed to identify the
optimal number of clusters within a dataset. However, users may not always seek
the absolute optimal number of clusters but rather a secondary option that
better aligns with their specific applications. This realization has led us to
introduce a Bayesian cluster validity index (BCVI), which builds upon existing
indices. The BCVI utilizes either Dirichlet or generalized Dirichlet priors,
resulting in the same posterior distribution. We evaluate our BCVI using the
Wiroonsri index for hard clustering and the Wiroonsri-Preedasawakul index for
soft clustering as underlying indices. We compare the performance of our
proposed BCVI with that of the original underlying indices and several other
existing CVIs, including Davies-Bouldin, Starczewski, Xie-Beni, and KWON2
indices. Our BCVI offers clear advantages in situations where user expertise is
valuable, allowing users to specify their desired range for the final number of
clusters. To illustrate this, we conduct experiments classified into three
different scenarios. Additionally, we showcase the practical applicability of
our approach through real-world datasets, such as MRI brain tumor images. These
tools will be published as a new R package 'BayesCVI'.
- Abstract(参考訳): クラスタ数を適切に選択することは、クラスタリングアルゴリズムを適用する上で重要なステップである。
このプロセスを支援するために、様々なクラスタ妥当性指標(CVI)が開発された。
これらの指標はデータセット内の最適なクラスタ数を特定するように設計されている。
しかし、ユーザは必ずしもクラスタの絶対的な最適数を求めるのではなく、特定のアプリケーションとよりよくマッチする二次的な選択肢を求めるかもしれない。
この実現により,既存の指標に基づくベイズクラスタ妥当性指数(BCVI)を導入することができた。
bcviはディリクレ(dirichlet)または一般化ディリクレ前駆体(generalized dirichlet priors)を使用しており、結果として同じ後方分布となる。
ハードクラスタリングのためのWiroonsri indexとソフトクラスタリングのためのWiroonsri-Preedasawakul indexを用いてBCVIを評価した。
我々は,提案したBCVIと,Davies-Bouldin,Starczewski,Xie-Beni,KWON2などの既存のCVIのパフォーマンスを比較した。
私たちのBCVIは、ユーザの専門知識が価値のある状況において明確なアドバンテージを提供しています。
これを説明するために、3つの異なるシナリオに分類した実験を行う。
また,MRI脳腫瘍画像などの実世界のデータセットを用いて,本手法の実用性を示す。
これらのツールは、新しいRパッケージ'BayesCVI'として公開される。
関連論文リスト
- ABCDE: Application-Based Cluster Diff Evals [49.1574468325115]
それは実用性を目指しており、アイテムはアプリケーション固有の重要な値を持つことができ、クラスタリングがどちらが優れているかを判断するときに人間の判断を使うのは粗悪であり、アイテムの任意のスライスのためのメトリクスを報告できる。
クラスタリング品質の差分を測定するアプローチは、高価な地平を前もって構築し、それに関して各クラスタリングを評価する代わりに、ABCDEはクラスタリング間の実際の差分に基づいて、判定のための質問をサンプリングする。
論文 参考訳(メタデータ) (2024-07-31T08:29:35Z) - MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence [97.93517982908007]
NCCは、ドメイン間数ショットの分類において、少数ショットの分類が可能なメートル法空間を構築するために表現を学ぶことを目的としている。
本稿では,異なるクラスから得られた2つの標本の NCC 学習表現に高い類似性があることを見出した。
ラベル付きデータによって示されるクラスタ構造にマッチするクラス固有の表現の集合を学習するために、最適化されたカーネル依存(MOKD)を最大化する二段階最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T05:59:52Z) - On the Use of Relative Validity Indices for Comparing Clustering Approaches [0.6990493129893111]
相対妥当性指標はクラスタリング結果の評価と最適化に広く用いられている。
クラスタリングのための類似パラダイム(SP)を選択する際に、RVIを使う文献が増えつつある。
本研究では,SP選択のためのRVIの信頼性に関する総合的研究を行った。
論文 参考訳(メタデータ) (2024-04-16T07:39:54Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - A correlation-based fuzzy cluster validity index with secondary options
detector [0.0]
本稿では,Wiroonsri-Preedasawakul(WP)インデックスとして知られる相関に基づくファジィクラスタの妥当性指標を提案する。
我々は,Xie-Beni,Pakhira-Bandyopadhyay-Maulik,Tang,Wu-Li,Generalized C,Kwon2などの既存指標と比較した。
論文 参考訳(メタデータ) (2023-08-28T16:40:34Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - A novel cluster internal evaluation index based on hyper-balls [11.048887848164268]
クラスタ分析において、品質を評価し、最適なクラスタ数を決定することが重要である。
本稿では,データセットの多粒度特徴付けを行い,ハイパーボールを得る。
ハイパーボール(HCVI)に基づくクラスタ内部評価指標を定義する。
論文 参考訳(メタデータ) (2022-12-30T02:56:40Z) - Are Cluster Validity Measures (In)valid? [3.7491936479803054]
本稿では、教師なし学習活動において、このような指標を客観的機能として扱うとどうなるかを検討する。
多くのクラスタ(無効度指数)が、専門家の知識にマッチするクラスタリングを促進することが判明した。
我々は、OWA演算子と近辺グラフ上に構築されたダン指数の、より優れた新しい変種を導入する。
論文 参考訳(メタデータ) (2022-08-02T06:08:48Z) - Implicit Sample Extension for Unsupervised Person Re-Identification [97.46045935897608]
クラスタリングは、時に異なる真のアイデンティティを混ぜ合わせたり、同じアイデンティティを2つ以上のサブクラスタに分割する。
本稿では,クラスタ境界周辺のサポートサンプルを生成するために,Implicit Sample Extension (OurWholeMethod)法を提案する。
提案手法の有効性を実証し,教師なしのRe-IDに対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-04-14T11:41:48Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Clustering performance analysis using new correlation based cluster
validity indices [0.0]
本研究では,2つのデータポイント間の実際の距離と,2つのポイントが位置するクラスタのセントロイド距離との相関に基づく2つの新しいクラスタ妥当性指標を開発した。
提案した指標は, 前述した弱点を克服する異なる数のクラスタにおいて, 常にいくつかのピークを発生させる。
論文 参考訳(メタデータ) (2021-09-23T06:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。