論文の概要: Boosting the Discriminant Power of Naive Bayes
- arxiv url: http://arxiv.org/abs/2209.09532v1
- Date: Tue, 20 Sep 2022 08:02:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 18:53:58.452108
- Title: Boosting the Discriminant Power of Naive Bayes
- Title(参考訳): ナイーブベイズの判別力を高める
- Authors: Shihe Wang, Jianfeng Ren, Xiaoyu Lian, Ruibin Bai, Xudong Jiang
- Abstract要約: 本稿では,スタックオートエンコーダを用いた特徴拡張手法を提案し,データ中のノイズを低減し,ベイズの識別力を高める。
実験結果から,提案手法は最先端のベイズ分類器よりも大きく,かつ一貫した性能を示した。
- 参考スコア(独自算出の注目度): 17.43377106246301
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Naive Bayes has been widely used in many applications because of its
simplicity and ability in handling both numerical data and categorical data.
However, lack of modeling of correlations between features limits its
performance. In addition, noise and outliers in the real-world dataset also
greatly degrade the classification performance. In this paper, we propose a
feature augmentation method employing a stack auto-encoder to reduce the noise
in the data and boost the discriminant power of naive Bayes. The proposed stack
auto-encoder consists of two auto-encoders for different purposes. The first
encoder shrinks the initial features to derive a compact feature representation
in order to remove the noise and redundant information. The second encoder
boosts the discriminant power of the features by expanding them into a
higher-dimensional space so that different classes of samples could be better
separated in the higher-dimensional space. By integrating the proposed feature
augmentation method with the regularized naive Bayes, the discrimination power
of the model is greatly enhanced. The proposed method is evaluated on a set of
machine-learning benchmark datasets. The experimental results show that the
proposed method significantly and consistently outperforms the state-of-the-art
naive Bayes classifiers.
- Abstract(参考訳): Naive Bayesは、数値データと分類データの両方を扱う単純さと能力のため、多くのアプリケーションで広く使われている。
しかし、特徴間の相関関係のモデル化の欠如は性能を制限している。
さらに、実世界のデータセットのノイズと外れ値も、分類性能を著しく低下させる。
本稿では,スタック自動エンコーダを用いて,データ中のノイズを低減し,ベイズの判別力を高める特徴拡張手法を提案する。
提案するスタックオートエンコーダは,異なる目的で2つのオートエンコーダで構成される。
第1エンコーダは、ノイズと冗長情報を除去するために、初期特徴を縮小してコンパクトな特徴表現を導出する。
第2のエンコーダは、それらを高次元の空間に拡張することで特徴の判別力を高めるので、異なる種類のサンプルを高次元の空間でより分離することができる。
提案手法を正規化したナイーブベイズと統合することにより,モデルの識別能力が大幅に向上した。
提案手法は,機械学習ベンチマークデータセットのセット上で評価される。
実験結果から,提案手法は最先端のベイズ分類器よりも大きく,かつ一貫した性能を示した。
関連論文リスト
- XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing [91.51897617724816]
ディープニューラルネットワークの現実的な応用は、ノイズの多い入力や敵攻撃に直面した場合、その不安定な予測によって妨げられる。
本稿では,モンテカルロサンプリングによるランダムな平滑化過程推定における分散が,分類器のリプシッツ定数とマージンと密接な相互作用を示す。
我々はベルンシュタインの濃度不等式と拡張されたリプシッツ境界をランダム化平滑化に利用し、実験結果から現在の最先端手法と比較して精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2023-09-28T22:41:47Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Improving the Robustness of Summarization Systems with Dual Augmentation [68.53139002203118]
頑健な要約システムは、入力中の特定の単語の選択やノイズに関わらず、文書のギストをキャプチャできるべきである。
まず,単語レベルの同義語置換や雑音を含む摂動に対する要約モデルの頑健性について検討する。
SummAttackerを提案する。これは言語モデルに基づく対数サンプルを生成するための効率的な手法である。
論文 参考訳(メタデータ) (2023-06-01T19:04:17Z) - Ensemble Classifier Design Tuned to Dataset Characteristics for Network
Intrusion Detection [0.0]
データセットのクラスオーバーラップ問題に対処する2つの新しいアルゴリズムが提案されている。
提案手法は二進分類と多進分類の両方で評価される。
論文 参考訳(メタデータ) (2022-05-08T21:06:42Z) - A Semi-Supervised Adaptive Discriminative Discretization Method
Improving Discrimination Power of Regularized Naive Bayes [0.48342038441006785]
半教師付き適応型ベイズ識別フレームワークを提案する。
ラベル付きデータとラベルなしデータの両方を擬似ラベル付け技術で利用することで、データ分布をより正確に推定できる。
また,適応的識別識別方式を用いて,識別時の情報損失を著しく低減する手法を提案する。
論文 参考訳(メタデータ) (2021-11-22T04:36:40Z) - Scalable Optimal Classifiers for Adversarial Settings under Uncertainty [10.90668635921398]
本稿では,攻撃者に対して目的が不明な攻撃者がクラス-1データを生成する対角的設定において,最適な分類器を見つけることの問題点を考察する。
この低次元キャラクタリゼーションにより,ほぼほぼ最適な分類器をスケーラブルに計算する訓練手法が開発可能であることを示す。
論文 参考訳(メタデータ) (2021-06-28T13:33:53Z) - Dual Adversarial Auto-Encoders for Clustering [152.84443014554745]
教師なしクラスタリングのためのDual-AAE(Dual-AAE)を提案する。
Dual-AAEの目的関数に対する変分推論を行うことで,一対のオートエンコーダをトレーニングすることで最適化可能な新たな再構成損失を導出する。
4つのベンチマーク実験により、Dual-AAEは最先端のクラスタリング手法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-23T13:16:34Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。