論文の概要: Analysis of Estimating the Bayes Rule for Gaussian Mixture Models with a
Specified Missing-Data Mechanism
- arxiv url: http://arxiv.org/abs/2210.13785v2
- Date: Fri, 29 Dec 2023 14:05:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 03:09:02.847570
- Title: Analysis of Estimating the Bayes Rule for Gaussian Mixture Models with a
Specified Missing-Data Mechanism
- Title(参考訳): 特定ミスデータ機構を用いたガウス混合モデルのベイズ則推定法の解析
- Authors: Ziyang Lyu
- Abstract要約: 半教師付き学習(SSL)アプローチは、幅広い工学と科学の分野でうまく適用されている。
本稿では、未分類観測のための欠落機構を持つ生成モデルフレームワークについて検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised learning (SSL) approaches have been successfully applied in a
wide range of engineering and scientific fields. This paper investigates the
generative model framework with a missingness mechanism for unclassified
observations, as introduced by Ahfock and McLachlan(2020). We show that in a
partially classified sample, a classifier using Bayes rule of allocation with a
missing-data mechanism can surpass a fully supervised classifier in a two-class
normal homoscedastic model, especially with moderate to low overlap and
proportion of missing class labels, or with large overlap but few missing
labels. It also outperforms a classifier with no missing-data mechanism
regardless of the overlap region or the proportion of missing class labels. Our
exploration of two- and three-component normal mixture models with unequal
covariances through simulations further corroborates our findings. Finally, we
illustrate the use of the proposed classifier with a missing-data mechanism on
interneuronal and skin lesion datasets.
- Abstract(参考訳): 半教師付き学習(SSL)アプローチは、幅広い工学と科学の分野でうまく適用されている。
本稿では、Ahfock と McLachlan (2020) が導入した、未分類観測のための欠落機構を持つ生成モデルフレームワークについて検討する。
一部分類されたサンプルでは、欠落データ機構を用いたベイズ規則を用いた分類器は、2クラス正規ホモシダモデルにおいて完全教師付き分類器を上回ることができ、特に中程度から低い重複率と欠落クラスラベルの割合で、あるいは重なりが大きいが欠落ラベルが少ない。
また、重複領域や欠落したクラスラベルの比率に関わらず、欠落データ機構のない分類器を上回ります。
シミュレーションにより不均等な共分散を持つ2成分および3成分の正規混合モデルの探索を行い, 以上の知見を裏付ける。
最後に,ニューロン間および皮膚病変データセットに欠測データ機構を付加した分類器について述べる。
関連論文リスト
- Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Imbalanced Classification via a Tabular Translation GAN [4.864819846886142]
本稿では,多数のサンプルを対応する合成マイノリティ標本にマッピングするために,新たな正規化損失を用いたジェネレーティブ・アドバイサル・ネットワークに基づくモデルを提案する。
提案手法は, 再加重法やオーバーサンプリング法と比較して, 平均精度を向上することを示す。
論文 参考訳(メタデータ) (2022-04-19T06:02:53Z) - Learning Gaussian Mixtures with Generalised Linear Models: Precise
Asymptotics in High-dimensions [79.35722941720734]
多クラス分類問題に対する一般化線形モデルは、現代の機械学習タスクの基本的な構成要素の1つである。
実験的リスク最小化による高次元推定器の精度を実証する。
合成データの範囲を超えて我々の理論をどのように適用できるかを論じる。
論文 参考訳(メタデータ) (2021-06-07T16:53:56Z) - Deep Generative Pattern-Set Mixture Models for Nonignorable Missingness [0.0]
無視できないデータと無視できないデータの両方をモデル化する可変オートエンコーダアーキテクチャを提案する。
モデルでは,観測されたデータと欠落マスクに基づいて,欠落したデータを欠落パターンにクラスタ化することを明示的に学習する。
当社のセットアップでは,無知かつ無知な欠如の特性をトレードオフすることで,両タイプのデータに適用することが可能である。
論文 参考訳(メタデータ) (2021-03-05T08:21:35Z) - Entropy-Based Uncertainty Calibration for Generalized Zero-Shot Learning [49.04790688256481]
一般化ゼロショット学習(GZSL)の目的は、目に見えないクラスと見えないクラスの両方を認識することである。
ほとんどのGZSLメソッドは、通常、見えないクラスの意味情報から視覚表現を合成することを学ぶ。
本論文では,三重項損失を持つ2重変分オートエンコーダを利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T05:21:27Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Open-Set Recognition with Gaussian Mixture Variational Autoencoders [91.3247063132127]
推論において、オープンセット分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶するかのどちらかである。
我々は,協調的に再構築を学習し,潜在空間におけるクラスベースのクラスタリングを行うよう,我々のモデルを訓練する。
我々のモデルは、より正確で堅牢なオープンセット分類結果を実現し、平均的なF1改善率は29.5%である。
論文 参考訳(メタデータ) (2020-06-03T01:15:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。