Fugu-MT 論文翻訳(概要): Finding Outliers in Gaussian Model-Based Clustering

論文の概要: Finding Outliers in Gaussian Model-Based Clustering

arxiv url: http://arxiv.org/abs/1907.01136v4
Date: Fri, 5 May 2023 14:51:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-08 18:46:56.741430
Title: Finding Outliers in Gaussian Model-Based Clustering
Title（参考訳）: ガウスモデルに基づくクラスタリングにおける外れ値の探索
Authors: Katharine M. Clark and Paul D. McNicholas
Abstract要約: 外層アルゴリズムは、外層包摂法とトリミング法という2つの広いカテゴリに分類される傾向がある。ログ類似度が基準分布に従うまで、最も可能性の低い点を除去するアルゴリズムが提案されている。この結果、本質的に外接数の数を推定するトリミング法が導かれる。
参考スコア（独自算出の注目度）: 2.4366811507669124
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Unsupervised classification, or clustering, is a problem often plagued by outliers, yet there is a paucity of work on handling outliers in unsupervised classification. Outlier algorithms tend to fall into two broad categories: outlier inclusion methods and trimming methods, which often require pre-specification of the number of points to remove. The fact that sample Mahalanobis distance is beta-distributed is used to derive an approximate distribution for the log-likelihoods of subset finite Gaussian mixture models. An algorithm is proposed that removes the least likely points, which are deemed outliers, until the log-likelihoods adhere to the reference distribution. This results in a trimming method which inherently estimates the number of outliers present.
Abstract（参考訳）: 教師なし分類(unsupervised classification)またはクラスタリング(clustering)は、異常者によってしばしば悩まされる問題である。外乱アルゴリズムは、外乱包含法とトリミング法という2つの広いカテゴリに分類される傾向があり、除去する点の数を事前に特定する必要がある。サンプルマハラノビス距離がβ分布であるという事実は、部分有限ガウス混合モデルの対数分布を近似的に導くために用いられる。対数類似度が基準分布に従うまで、外れ値と見なされる最も可能性の低い点を除去するアルゴリズムが提案されている。この結果、トリミング法は本質的に存在する外れ値の数を推定する。

関連論文リスト

Towards Learnable Anchor for Deep Multi-View Clustering [49.767879678193005]
本稿では,線形時間でクラスタリングを行うDeep Multi-view Anchor Clustering (DMAC)モデルを提案する。最適なアンカーを用いて、全サンプルグラフを計算し、クラスタリングのための識別的埋め込みを導出する。いくつかのデータセットの実験では、最先端の競合に比べてDMACの性能と効率が優れていることが示されている。
論文参考訳（メタデータ） (2025-03-16T09:38:11Z)
Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文参考訳（メタデータ） (2025-01-06T12:35:51Z)
Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文参考訳（メタデータ） (2023-06-18T08:46:06Z)
A Computational Theory and Semi-Supervised Algorithm for Clustering [0.0]
半教師付きクラスタリングアルゴリズムを提案する。クラスタリング法のカーネルは、Mohammadの異常検出アルゴリズムである。結果は、合成および実世界のデータセットで示される。
論文参考訳（メタデータ） (2023-06-12T09:15:58Z)
Robust Outlier Rejection for 3D Registration with Variational Bayes [70.98659381852787]
我々は、ロバストアライメントのための新しい変分非局所ネットワークベース外乱除去フレームワークを開発した。そこで本稿では, 投票に基づく不整合探索手法を提案し, 変換推定のための高品質な仮説的不整合をクラスタリングする。
論文参考訳（メタデータ） (2023-04-04T03:48:56Z)
Numerically assisted determination of local models in network scenarios [55.2480439325792]
統計的振る舞いを再現する明示的な局所モデルを見つけるための数値ツールを開発する。グリーンベルガー・ホルン・ザイリンガー(GHZ)およびW分布の臨界振動性に関する予想を提供する。開発されたコードとドキュメントは、281.com/mariofilho/localmodelsで公開されている。
論文参考訳（メタデータ） (2023-03-17T13:24:04Z)
Robust computation of optimal transport by $\eta$-potential regularization [79.24513412588745]
最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。我々は、いわゆる$beta$-divergenceに付随するベータポテンシャル項でOTを正規化することを提案する。提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定するのに役立つことを実験的に実証した。
論文参考訳（メタデータ） (2022-12-26T18:37:28Z)
SSDBCODI: Semi-Supervised Density-Based Clustering with Outliers Detection Integrated [1.8444322599555096]
クラスタリング分析は、機械学習における重要なタスクの1つだ。クラスタリングクラスタリングのパフォーマンスが、異常値によって著しく損なわれる可能性があるため、アルゴリズムは、異常値検出のプロセスを組み込もうとする。我々は,半教師付き検出素子であるSSDBCODIを提案する。
論文参考訳（メタデータ） (2022-08-10T21:06:38Z)
Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。最近の研究は、低次手法のクラスに対する低い境界を確立している。意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文参考訳（メタデータ） (2021-12-07T18:50:17Z)
Mean-based Best Arm Identification in Stochastic Bandits under Reward Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文参考訳（メタデータ） (2021-11-14T21:49:58Z)
C-AllOut: Catching & Calling Outliers by Type [10.69970450827617]
C-AllOutは、型別に外れ値に注釈を付ける新しい外れ値検出器である。パラメータフリーでスケーラブルであり、必要であればペアワイズな類似点(あるいは距離)でのみ動作する。
論文参考訳（メタデータ） (2021-10-13T14:25:52Z)
Revisiting Agglomerative Clustering [4.291340656866855]
クラスターのモデルも採用され、遷移によって囲まれた高密度の核が続き、その後は外れ値が続いた。得られた結果は、多くの手法が単調なデータ中の2つのクラスタを検出することの検証を含む。単一リンク法は偽陽性に対する耐性が高かった。
論文参考訳（メタデータ） (2020-05-16T14:07:25Z)
Robust M-Estimation Based Bayesian Cluster Enumeration for Real Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文参考訳（メタデータ） (2020-05-04T11:44:49Z)
A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文参考訳（メタデータ） (2020-02-25T18:53:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。