論文の概要: Optimal Projections for Classification with Naive Bayes
- arxiv url: http://arxiv.org/abs/2409.05635v1
- Date: Mon, 9 Sep 2024 14:05:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 14:29:54.997653
- Title: Optimal Projections for Classification with Naive Bayes
- Title(参考訳): ナイーブベイを用いた分類のための最適投影法
- Authors: David P. Hofmeyr, Francois Kamper, Michail M. Melonas,
- Abstract要約: 本研究では,クラス条件密度の因子化のための代替的基礎を得るという課題について検討する。
この問題を射影探索として定式化し, 分類を行う最適線形射影を求める。
提案手法は、他の一般的な確率的判別分析モデルよりも大幅に優れていることがわかった。
- 参考スコア(独自算出の注目度): 5.953513005270837
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the Naive Bayes classification model the class conditional densities are estimated as the products of their marginal densities along the cardinal basis directions. We study the problem of obtaining an alternative basis for this factorisation with the objective of enhancing the discriminatory power of the associated classification model. We formulate the problem as a projection pursuit to find the optimal linear projection on which to perform classification. Optimality is determined based on the multinomial likelihood within which probabilities are estimated using the Naive Bayes factorisation of the projected data. Projection pursuit offers the added benefits of dimension reduction and visualisation. We discuss an intuitive connection with class conditional independent components analysis, and show how this is realised visually in practical applications. The performance of the resulting classification models is investigated using a large collection of (162) publicly available benchmark data sets and in comparison with relevant alternatives. We find that the proposed approach substantially outperforms other popular probabilistic discriminant analysis models and is highly competitive with Support Vector Machines.
- Abstract(参考訳): ネイブベイズ分類モデルでは、クラス条件密度は、基準基底方向に沿った境界密度の積として推定される。
本研究では, 関連する分類モデルの識別能力を高めることを目的として, この分解の代替的基盤を得るという課題について検討する。
この問題を射影探索として定式化し, 分類を行う最適線形射影を求める。
予測されたデータのネイブベイズ因数分解を用いて確率を推定する多項確率に基づいて最適性を決定する。
投影追跡は次元の縮小と可視化の付加的な利点を提供する。
本稿では、クラス条件付き独立成分分析と直感的な関係を論じ、これが実際的な応用においてどのように視覚的に実現されているかを示す。
得られた分類モデルの性能は, 公開されているベンチマークデータセットの大規模なコレクションを用いて検討し, 関連する代替案と比較した。
提案手法は,他の確率的判別分析モデルよりも大幅に優れており,Support Vector Machinesと高い競争力を持つことがわかった。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Deep Neural Network Benchmarks for Selective Classification [27.098996474946446]
複数の選択的な分類フレームワークが存在し、その多くはディープニューラルネットワークアーキテクチャに依存している。
提案手法は,選択誤差率,経験的カバレッジ,拒否されたインスタンスのクラス分布,アウト・オブ・ディストリビューション・インスタンスの性能など,いくつかの基準を用いて評価する。
論文 参考訳(メタデータ) (2024-01-23T12:15:47Z) - Characterizing the Optimal 0-1 Loss for Multi-class Classification with
a Test-time Attacker [57.49330031751386]
我々は,任意の離散データセット上の複数クラス分類器に対するテスト時間攻撃の存在下での損失に対する情報理論的下位境界を求める。
本稿では,データと敵対的制約から競合ハイパーグラフを構築する際に発生する最適0-1損失を求めるための一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-21T15:17:13Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Classification via score-based generative modelling [0.0]
識別的・生成的分類設定におけるスコアベース学習の適用について検討した。
シミュレーションおよび実世界のデータセットについて実験を行い、バイナリ分類性能の達成と改善の有効性を実証した。
論文 参考訳(メタデータ) (2022-07-22T13:59:43Z) - Beyond Adult and COMPAS: Fairness in Multi-Class Prediction [8.405162568925405]
我々は、この問題を、事前訓練された(そして潜在的に不公平な)分類器を、対象のグループフェアネス要件を満たすモデルの集合に「投影する」という観点で定式化する。
投影された分類器を並列化して計算し、サンプルの複雑性と収束保証の両方を導出する反復アルゴリズムを提案する。
また,複数のクラス,複数の交差保護グループ,100万以上のサンプルを持つオープンデータセット上で,本手法を大規模に評価した。
論文 参考訳(メタデータ) (2022-06-15T20:29:33Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms [0.8376091455761261]
このフレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャストできることを示した。
そして,提案問題において,分類結果の「解決不能な部分データ選択」が強く解決可能であることを示す。
これにより、分類インスタンスを解決するための反復精錬戦略(IRS)の開発を動機付けます。
論文 参考訳(メタデータ) (2020-12-22T21:09:38Z) - Robust Bayesian Classification Using an Optimistic Score Ratio [18.047694351309204]
クラス条件、文脈、分布に関する情報が限られている場合に、楽観的なスコア比を頑健なバイナリ分類に使用します。
楽観的なスコアは、テストサンプルの観察結果を説明するのに最も有効な分布を探索する。
論文 参考訳(メタデータ) (2020-07-08T22:25:29Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。