論文の概要: Finding Outliers in Gaussian Model-Based Clustering
- arxiv url: http://arxiv.org/abs/1907.01136v4
- Date: Fri, 5 May 2023 14:51:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 18:46:56.741430
- Title: Finding Outliers in Gaussian Model-Based Clustering
- Title(参考訳): ガウスモデルに基づくクラスタリングにおける外れ値の探索
- Authors: Katharine M. Clark and Paul D. McNicholas
- Abstract要約: 外層アルゴリズムは、外層包摂法とトリミング法という2つの広いカテゴリに分類される傾向がある。
ログ類似度が基準分布に従うまで、最も可能性の低い点を除去するアルゴリズムが提案されている。
この結果、本質的に外接数の数を推定するトリミング法が導かれる。
- 参考スコア(独自算出の注目度): 2.4366811507669124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised classification, or clustering, is a problem often plagued by
outliers, yet there is a paucity of work on handling outliers in unsupervised
classification. Outlier algorithms tend to fall into two broad categories:
outlier inclusion methods and trimming methods, which often require
pre-specification of the number of points to remove. The fact that sample
Mahalanobis distance is beta-distributed is used to derive an approximate
distribution for the log-likelihoods of subset finite Gaussian mixture models.
An algorithm is proposed that removes the least likely points, which are deemed
outliers, until the log-likelihoods adhere to the reference distribution. This
results in a trimming method which inherently estimates the number of outliers
present.
- Abstract(参考訳): 教師なし分類(unsupervised classification)またはクラスタリング(clustering)は、異常者によってしばしば悩まされる問題である。
外乱アルゴリズムは、外乱包含法とトリミング法という2つの広いカテゴリに分類される傾向があり、除去する点の数を事前に特定する必要がある。
サンプルマハラノビス距離がβ分布であるという事実は、部分有限ガウス混合モデルの対数分布を近似的に導くために用いられる。
対数類似度が基準分布に従うまで、外れ値と見なされる最も可能性の低い点を除去するアルゴリズムが提案されている。
この結果、トリミング法は本質的に存在する外れ値の数を推定する。
関連論文リスト
- Entropy regularization in probabilistic clustering [0.0]
クラスタリング構成の新しいベイズ推定器を提案する。
提案手法は,スパースクラスタ数の削減を目的とした後処理手法と等価である。
論文 参考訳(メタデータ) (2023-07-19T15:36:40Z) - A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
半教師付きクラスタリングアルゴリズムを提案する。
クラスタリング法のカーネルは、Mohammadの異常検出アルゴリズムである。
結果は、合成および実世界のデータセットで示される。
論文 参考訳(メタデータ) (2023-06-12T09:15:58Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly
Types [60.45942774425782]
我々は異常クラスタリングを導入し、その目標はデータを異常型の一貫性のあるクラスタにまとめることである。
これは異常検出とは違い、その目標は異常を通常のデータから分割することである。
パッチベースの事前訓練されたディープ埋め込みとオフザシェルフクラスタリング手法を用いた,単純で効果的なクラスタリングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-21T23:11:33Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Multi-label Contrastive Predictive Coding [125.03510235962095]
差分相互情報(MI)推定器は、コントラスト予測符号化(CPC)のような教師なし表現学習法で広く利用されている。
本稿では,複数の正のサンプルを同時に同定する必要がある多ラベル分類問題に基づく新しい推定器を提案する。
同一量の負のサンプルを用いて複数ラベルのCPCが$log m$boundを超えることができる一方で、相互情報の有意な下限であることを示す。
論文 参考訳(メタデータ) (2020-07-20T02:46:21Z) - A generalized Bayes framework for probabilistic clustering [3.3194866396158]
k平均とその変種のようなロスベースのクラスタリング手法は、データ内のグループを見つけるための標準ツールである。
混合モデルに基づくモデルベースのクラスタリングは代替手段を提供するが、そのような手法は計算上の問題に直面し、カーネルの選択に対して大きな感度を持つ。
本稿では,これらの2つのパラダイムをGibs後続法を用いてブリッジする一般化ベイズフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T18:49:32Z) - Revisiting Agglomerative Clustering [4.291340656866855]
クラスターのモデルも採用され、遷移によって囲まれた高密度の核が続き、その後は外れ値が続いた。
得られた結果は、多くの手法が単調なデータ中の2つのクラスタを検出することの検証を含む。
単一リンク法は偽陽性に対する耐性が高かった。
論文 参考訳(メタデータ) (2020-05-16T14:07:25Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。