論文の概要: Entropy regularization in probabilistic clustering
- arxiv url: http://arxiv.org/abs/2307.10065v1
- Date: Wed, 19 Jul 2023 15:36:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 13:27:59.725899
- Title: Entropy regularization in probabilistic clustering
- Title(参考訳): 確率的クラスタリングにおけるエントロピー正規化
- Authors: Beatrice Franzolini and Giovanni Rebaudo
- Abstract要約: クラスタリング構成の新しいベイズ推定器を提案する。
提案手法は,スパースクラスタ数の削減を目的とした後処理手法と等価である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Bayesian nonparametric mixture models are widely used to cluster
observations. However, one major drawback of the approach is that the estimated
partition often presents unbalanced clusters' frequencies with only a few
dominating clusters and a large number of sparsely-populated ones. This feature
translates into results that are often uninterpretable unless we accept to
ignore a relevant number of observations and clusters. Interpreting the
posterior distribution as penalized likelihood, we show how the unbalance can
be explained as a direct consequence of the cost functions involved in
estimating the partition. In light of our findings, we propose a novel Bayesian
estimator of the clustering configuration. The proposed estimator is equivalent
to a post-processing procedure that reduces the number of sparsely-populated
clusters and enhances interpretability. The procedure takes the form of
entropy-regularization of the Bayesian estimate. While being computationally
convenient with respect to alternative strategies, it is also theoretically
justified as a correction to the Bayesian loss function used for point
estimation and, as such, can be applied to any posterior distribution of
clusters, regardless of the specific model used.
- Abstract(参考訳): ベイズ非パラメトリック混合モデルはクラスター観測に広く用いられている。
しかし、このアプローチの大きな欠点の1つは、推定されたパーティションが、少数の支配的クラスタと多数の人口の少ないクラスタで、しばしば不均衡なクラスタの周波数を示すことである。
この機能は、関連する多くの観測やクラスターを無視しない限り、しばしば解釈できない結果に翻訳される。
後続分布をペナル化確率と解釈し, 分割推定におけるコスト関数の直接的な帰結として不均衡を説明できることを示す。
そこで本研究では,クラスタリング構成のベイズ推定器を提案する。
提案手法は,スパースクラスタの数を減らし,解釈可能性を高める後処理手法と等価である。
この手順はベイズ推定のエントロピー正則化の形を取る。
代替戦略に関して計算上便利であるが、理論上は、点推定に用いられるベイズ損失関数の補正として正当化され、使用する特定のモデルに関係なく、任意のクラスターの後方分布に適用することができる。
関連論文リスト
- Bayesian Renormalization [68.8204255655161]
ベイズ統計的推論にインスパイアされた再正規化に対する完全情報理論的アプローチを提案する。
ベイズ再正規化の主な洞察は、フィッシャー計量が創発的RGスケールの役割を担う相関長を定義することである。
本研究では,ベイズ正規化方式が既存のデータ圧縮法やデータ生成法とどのように関係しているかを考察する。
論文 参考訳(メタデータ) (2023-05-17T18:00:28Z) - A Statistical Model for Predicting Generalization in Few-Shot
Classification [6.158812834002346]
一般化誤差を予測するために,特徴分布のガウスモデルを導入する。
提案手法は, 相互検証戦略の離脱など, 代替案よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-13T10:21:15Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - A generalized Bayes framework for probabilistic clustering [3.3194866396158]
k平均とその変種のようなロスベースのクラスタリング手法は、データ内のグループを見つけるための標準ツールである。
混合モデルに基づくモデルベースのクラスタリングは代替手段を提供するが、そのような手法は計算上の問題に直面し、カーネルの選択に対して大きな感度を持つ。
本稿では,これらの2つのパラダイムをGibs後続法を用いてブリッジする一般化ベイズフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T18:49:32Z) - Sparse Cholesky covariance parametrization for recovering latent
structure in ordered data [1.5349431582672617]
共分散行列のコレスキー因子における任意の零パターンに着目する。
そこで本研究では,行列損失のペナル化に基づく新しい推定手法を提案する。
実験結果に基づいて、各設定にどの方法がより適切か分析する。
論文 参考訳(メタデータ) (2020-06-02T08:35:00Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - Batch Stationary Distribution Estimation [98.18201132095066]
サンプル遷移の組を与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。
与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。
論文 参考訳(メタデータ) (2020-03-02T09:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。