論文の概要: Robust Generalised Quadratic Discriminant Analysis
- arxiv url: http://arxiv.org/abs/2004.06568v1
- Date: Sat, 11 Apr 2020 18:21:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 09:58:20.158000
- Title: Robust Generalised Quadratic Discriminant Analysis
- Title(参考訳): ロバスト一般化二次判別分析
- Authors: Abhik Ghosh, Rita SahaRay, Sayan Chakrabarty, Sayan Bhadra
- Abstract要約: GQDAにおける分類規則は, サンプル平均ベクトルとトレーニングサンプルのサンプル分散行列に基づいており, データの汚染下では極めて非腐食である。
本稿では, GQDA分類器の性能について, 平均ベクトルとそれを用いた分散行列の古典的推定器を, 様々な頑健な推定器に置き換えた際の検討を行った。
- 参考スコア(独自算出の注目度): 6.308539010172309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quadratic discriminant analysis (QDA) is a widely used statistical tool to
classify observations from different multivariate Normal populations. The
generalized quadratic discriminant analysis (GQDA) classification
rule/classifier, which generalizes the QDA and the minimum Mahalanobis distance
(MMD) classifiers to discriminate between populations with underlying
elliptically symmetric distributions competes quite favorably with the QDA
classifier when it is optimal and performs much better when QDA fails under
non-Normal underlying distributions, e.g. Cauchy distribution. However, the
classification rule in GQDA is based on the sample mean vector and the sample
dispersion matrix of a training sample, which are extremely non-robust under
data contamination. In real world, since it is quite common to face data highly
vulnerable to outliers, the lack of robustness of the classical estimators of
the mean vector and the dispersion matrix reduces the efficiency of the GQDA
classifier significantly, increasing the misclassification errors. The present
paper investigates the performance of the GQDA classifier when the classical
estimators of the mean vector and the dispersion matrix used therein are
replaced by various robust counterparts. Applications to various real data sets
as well as simulation studies reveal far better performance of the proposed
robust versions of the GQDA classifier. A Comparative study has been made to
advocate the appropriate choice of the robust estimators to be used in a
specific situation of the degree of contamination of the data sets.
- Abstract(参考訳): 二次判別分析(QDA)は多変量正常集団の観察を分類するために広く用いられている統計手法である。
qdaと最小マハラノビス距離(mmd)の分類器を一般化した一般化された二次判別分析(gqda)分類規則/分類器は、下位の楕円対称分布を持つ集団を判別するものであり、qda分類器が最適であればqda分類器と非常に有利に競合し、qdaが非正規基底分布(例えばコーシー分布)下で故障した場合に非常に優れた性能を発揮する。
しかし, GQDAにおける分類規則は, サンプル平均ベクトルとトレーニング試料の試料分散行列に基づいており, データの汚染下では極めて非腐食である。
実世界では、異常値に対して非常に脆弱なデータに直面することは極めて一般的であるため、平均ベクトルと分散行列の古典的推定器のロバスト性の欠如は、gqda分類器の効率を大幅に低下させ、誤分類誤差を増大させる。
本稿では, GQDA分類器の性能について, 平均ベクトルとそれを用いた分散行列の古典的推定器を, 様々な頑健な推定器に置き換えた際の検討を行った。
様々な実データやシミュレーション研究への応用は,提案したGQDA分類器の頑健なバージョンよりもはるかに優れた性能を示す。
データセットの汚染度合いの特定の状況で使用するロバストな推定器の適切な選択を主張するために、比較研究がなされている。
関連論文リスト
- Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Divide-and-Conquer Hard-thresholding Rules in High-dimensional
Imbalanced Classification [1.0312968200748118]
高次元の線形判別分析(LDA)における不均衡クラスサイズの影響について検討した。
マイノリティ・クラスと呼ばれる1つのクラスのデータの不足により、LDAはマイノリティ・クラスを無視し、最大誤分類率を得ることを示す。
そこで本研究では,不等式化率の大きな差を低減させる分割・対数法に基づくハードコンカレンスルールの新たな構成法を提案する。
論文 参考訳(メタデータ) (2021-11-05T07:44:28Z) - Self-Weighted Robust LDA for Multiclass Classification with Edge Classes [111.5515086563592]
SWRLDAと呼ばれる,l21ノルムを基準とした新しい自己重み付き頑健なLDAを提案する。
提案するSWRLDAは実装が容易で,実際に高速に収束する。
論文 参考訳(メタデータ) (2020-09-24T12:32:55Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Improved Design of Quadratic Discriminant Analysis Classifier in
Unbalanced Settings [19.763768111774134]
分類のための二次判別分析(QDA)またはその正規化バージョン(R-QDA)は推奨されないことが多い。
本稿では2つの正規化パラメータと修正バイアスに基づく改良されたR-QDAを提案する。
論文 参考訳(メタデータ) (2020-06-11T12:17:05Z) - A Compressive Classification Framework for High-Dimensional Data [12.284934135116515]
本稿では,データ次元がサンプルサイズよりもかなり高い設定のための圧縮分類フレームワークを提案する。
提案手法は線形判別分析に基づく正規化判別分析(CRDA)と呼ばれる。
識別規則における強しきい値化を促進するジョイントスパーシティを用いることで、重要な特徴を選択できる。
論文 参考訳(メタデータ) (2020-05-09T06:55:00Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。