論文の概要: Finding Outliers in Gaussian Model-Based Clustering
- arxiv url: http://arxiv.org/abs/1907.01136v4
- Date: Fri, 5 May 2023 14:51:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 18:46:56.741430
- Title: Finding Outliers in Gaussian Model-Based Clustering
- Title(参考訳): ガウスモデルに基づくクラスタリングにおける外れ値の探索
- Authors: Katharine M. Clark and Paul D. McNicholas
- Abstract要約: 外層アルゴリズムは、外層包摂法とトリミング法という2つの広いカテゴリに分類される傾向がある。
ログ類似度が基準分布に従うまで、最も可能性の低い点を除去するアルゴリズムが提案されている。
この結果、本質的に外接数の数を推定するトリミング法が導かれる。
- 参考スコア(独自算出の注目度): 2.4366811507669124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised classification, or clustering, is a problem often plagued by
outliers, yet there is a paucity of work on handling outliers in unsupervised
classification. Outlier algorithms tend to fall into two broad categories:
outlier inclusion methods and trimming methods, which often require
pre-specification of the number of points to remove. The fact that sample
Mahalanobis distance is beta-distributed is used to derive an approximate
distribution for the log-likelihoods of subset finite Gaussian mixture models.
An algorithm is proposed that removes the least likely points, which are deemed
outliers, until the log-likelihoods adhere to the reference distribution. This
results in a trimming method which inherently estimates the number of outliers
present.
- Abstract(参考訳): 教師なし分類(unsupervised classification)またはクラスタリング(clustering)は、異常者によってしばしば悩まされる問題である。
外乱アルゴリズムは、外乱包含法とトリミング法という2つの広いカテゴリに分類される傾向があり、除去する点の数を事前に特定する必要がある。
サンプルマハラノビス距離がβ分布であるという事実は、部分有限ガウス混合モデルの対数分布を近似的に導くために用いられる。
対数類似度が基準分布に従うまで、外れ値と見なされる最も可能性の低い点を除去するアルゴリズムが提案されている。
この結果、トリミング法は本質的に存在する外れ値の数を推定する。
関連論文リスト
- Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
半教師付きクラスタリングアルゴリズムを提案する。
クラスタリング法のカーネルは、Mohammadの異常検出アルゴリズムである。
結果は、合成および実世界のデータセットで示される。
論文 参考訳(メタデータ) (2023-06-12T09:15:58Z) - Robust Outlier Rejection for 3D Registration with Variational Bayes [70.98659381852787]
我々は、ロバストアライメントのための新しい変分非局所ネットワークベース外乱除去フレームワークを開発した。
そこで本稿では, 投票に基づく不整合探索手法を提案し, 変換推定のための高品質な仮説的不整合をクラスタリングする。
論文 参考訳(メタデータ) (2023-04-04T03:48:56Z) - Numerically assisted determination of local models in network scenarios [55.2480439325792]
統計的振る舞いを再現する明示的な局所モデルを見つけるための数値ツールを開発する。
グリーンベルガー・ホルン・ザイリンガー(GHZ)およびW分布の臨界振動性に関する予想を提供する。
開発されたコードとドキュメントは、281.com/mariofilho/localmodelsで公開されている。
論文 参考訳(メタデータ) (2023-03-17T13:24:04Z) - SSDBCODI: Semi-Supervised Density-Based Clustering with Outliers
Detection Integrated [1.8444322599555096]
クラスタリング分析は、機械学習における重要なタスクの1つだ。
クラスタリングクラスタリングのパフォーマンスが、異常値によって著しく損なわれる可能性があるため、アルゴリズムは、異常値検出のプロセスを組み込もうとする。
我々は,半教師付き検出素子であるSSDBCODIを提案する。
論文 参考訳(メタデータ) (2022-08-10T21:06:38Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - C-AllOut: Catching & Calling Outliers by Type [10.69970450827617]
C-AllOutは、型別に外れ値に注釈を付ける新しい外れ値検出器である。
パラメータフリーでスケーラブルであり、必要であればペアワイズな類似点(あるいは距離)でのみ動作する。
論文 参考訳(メタデータ) (2021-10-13T14:25:52Z) - Revisiting Agglomerative Clustering [4.291340656866855]
クラスターのモデルも採用され、遷移によって囲まれた高密度の核が続き、その後は外れ値が続いた。
得られた結果は、多くの手法が単調なデータ中の2つのクラスタを検出することの検証を含む。
単一リンク法は偽陽性に対する耐性が高かった。
論文 参考訳(メタデータ) (2020-05-16T14:07:25Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。