論文の概要: Identifying bias in cluster quality metrics
- arxiv url: http://arxiv.org/abs/2112.06287v1
- Date: Sun, 12 Dec 2021 17:56:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 08:21:54.916503
- Title: Identifying bias in cluster quality metrics
- Title(参考訳): クラスタ品質メトリクスにおけるバイアスの識別
- Authors: Mart\'i Renedo-Mirambell and Argimiro Arratia
- Abstract要約: コンダクタンスやモジュール性など,一般的なクラスタ品質指標の潜在的なバイアスについて検討する。
本稿では,モジュール性と優先アタッチメントブロックモデルの両方を用いて,事前設定されたコミュニティ構造を持つネットワークを生成する手法を提案する。
これらのモデルにより、さまざまな強度のマルチレベル構造を生成できるため、メトリクスがより大きなクラスタや小さなクラスタへの分割を好むかどうかが分かる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study potential biases of popular cluster quality metrics, such as
conductance or modularity. We propose a method that uses both stochastic and
preferential attachment block models construction to generate networks with
preset community structures, to which quality metrics will be applied. These
models also allow us to generate multi-level structures of varying strength,
which will show if metrics favour partitions into a larger or smaller number of
clusters. Additionally, we propose another quality metric, the density ratio.
We observed that most of the studied metrics tend to favour partitions into a
smaller number of big clusters, even when their relative internal and external
connectivity are the same. The metrics found to be less biased are modularity
and density ratio.
- Abstract(参考訳): コンダクタンスやモジュール性など,一般的なクラスタ品質指標の潜在的なバイアスについて検討する。
本稿では,事前設定されたコミュニティ構造を持つネットワークを生成するために,確率的および優先的アタッチメントブロックモデルの構築手法を提案する。
これらのモデルにより、さまざまな強度のマルチレベル構造を生成できるため、メトリクスがより大きなクラスタや小さなクラスタへの分割を好むかどうかが分かる。
さらに,別の品質指標である密度比を提案する。
調査対象のメトリクスのほとんどは、相対的な内部接続と外部接続が同じであっても、少数の大きなクラスタに分割する傾向にあります。
バイアスが少ないことが判明したメトリクスは、モジュラリティと密度比である。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Pointwise Metrics for Clustering Evaluation [0.0]
本稿では、2つのクラスタリングの類似性を特徴付けるためのメトリクスの集合である、ポイントワイズクラスタリングメトリクスを定義する。
計量の定義は標準集合論の概念に基づいており、理解し易い。
メトリクスを個々のアイテム、クラスタ、任意のアイテムのスライス、全体的なクラスタリングに割り当てることが可能です。
論文 参考訳(メタデータ) (2024-05-16T19:49:35Z) - Calibrating Large Language Models with Sample Consistency [76.23956851098598]
本稿では,複数サンプルモデル生成系の分布から信頼度を導出する可能性について,一貫性の3つの尺度を用いて検討する。
その結果、一貫性に基づくキャリブレーション手法は、既存のポストホック手法よりも優れていることがわかった。
種々のLMの特性に合わせて,キャリブレーションに適した整合性指標を選択するための実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-02-21T16:15:20Z) - Learning Group Importance using the Differentiable Hypergeometric
Distribution [16.30064635746202]
要素を未知のサイズのサブセットに分割することは、多くのアプリケーションで必須である。
本研究では,微分可能超幾何分布を提案する。
弱教師付き学習とクラスタリングという2つの典型的なアプリケーションで,サブセットのサイズを学習できることが示される。
論文 参考訳(メタデータ) (2022-03-03T10:44:50Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Measuring and Explaining the Inter-Cluster Reliability of
Multidimensional Projections [14.286703826000213]
多次元射影(MDP)のクラスタ間信頼性を測定するための定常性と密着性を提案する。
クラスタ間信頼性の測定は、クラスタ間タスクの実施方法に直接的な影響を与えるため、非常に重要です。
論文 参考訳(メタデータ) (2021-07-16T12:52:13Z) - Post-mortem on a deep learning contest: a Simpson's paradox and the
complementary roles of scale metrics versus shape metrics [61.49826776409194]
我々は、ニューラルネットワーク(NN)モデルの一般化精度を予測するために、コンテストで公に利用可能にされたモデルのコーパスを分析する。
メトリクスが全体としてよく機能するが、データのサブパーティションではあまり機能しない。
本稿では,データに依存しない2つの新しい形状指標と,一連のNNのテスト精度の傾向を予測できるデータ依存指標を提案する。
論文 参考訳(メタデータ) (2021-06-01T19:19:49Z) - Skeleton Clustering: Dimension-Free Density-based Clustering [0.2538209532048866]
本稿では,スケルトンクラスタリングという密度に基づくクラスタリング手法を提案する。
次元の呪いを回避すべく,次元に依存しないが直感的な幾何学的解釈を持つ代理密度測度を提案する。
論文 参考訳(メタデータ) (2021-04-21T21:25:02Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Statistical inference of assortative community structures [0.0]
本研究では,非パラメトリックなベイズ型分割モデルの定式化に基づいて,ネットワーク内のコンソーシアティブなコミュニティを推定する手法を開発した。
我々は,提案手法が解決限界に達していないことを示し,任意に多数のコミュニティを発見できることを示した。
論文 参考訳(メタデータ) (2020-06-25T15:44:05Z) - Group Heterogeneity Assessment for Multilevel Models [68.95633278540274]
多くのデータセットは固有のマルチレベル構造を含む。
この構造を考慮に入れることは、そのようなデータ上で行われた統計分析の正確性と校正にとって重要である。
本稿では,データ内のグループ化変数のレベルの違いを効率的に評価するフレキシブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-06T12:42:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。