論文の概要: A Semi-Supervised Adaptive Discriminative Discretization Method
Improving Discrimination Power of Regularized Naive Bayes
- arxiv url: http://arxiv.org/abs/2111.10983v3
- Date: Wed, 5 Apr 2023 02:26:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 16:44:37.309196
- Title: A Semi-Supervised Adaptive Discriminative Discretization Method
Improving Discrimination Power of Regularized Naive Bayes
- Title(参考訳): 正則化ネーブベイの判別能力を向上させる半改良適応判別法
- Authors: Shihe Wang, Jianfeng Ren and Ruibin Bai
- Abstract要約: 半教師付き適応型ベイズ識別フレームワークを提案する。
ラベル付きデータとラベルなしデータの両方を擬似ラベル付け技術で利用することで、データ分布をより正確に推定できる。
また,適応的識別識別方式を用いて,識別時の情報損失を著しく低減する手法を提案する。
- 参考スコア(独自算出の注目度): 0.48342038441006785
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, many improved naive Bayes methods have been developed with enhanced
discrimination capabilities. Among them, regularized naive Bayes (RNB) produces
excellent performance by balancing the discrimination power and generalization
capability. Data discretization is important in naive Bayes. By grouping
similar values into one interval, the data distribution could be better
estimated. However, existing methods including RNB often discretize the data
into too few intervals, which may result in a significant information loss. To
address this problem, we propose a semi-supervised adaptive discriminative
discretization framework for naive Bayes, which could better estimate the data
distribution by utilizing both labeled data and unlabeled data through
pseudo-labeling techniques. The proposed method also significantly reduces the
information loss during discretization by utilizing an adaptive discriminative
discretization scheme, and hence greatly improves the discrimination power of
classifiers. The proposed RNB+, i.e., regularized naive Bayes utilizing the
proposed discretization framework, is systematically evaluated on a wide range
of machine-learning datasets. It significantly and consistently outperforms
state-of-the-art NB classifiers.
- Abstract(参考訳): 近年,改良されたナイーブベイズ法が多数開発され,識別能力が向上している。
これらのうち、正規化ベイズ(RNB)は、識別力と一般化能力のバランスをとることで優れた性能を発揮する。
ベイズではデータの識別が重要である。
類似した値を1つの間隔にグループ化することで、データ分布をよりよく推定できる。
しかし、RNBを含む既存の手法は、データをわずかな間隔で区別することが多く、重大な情報損失をもたらす可能性がある。
そこで本研究では,ラベル付きデータとラベルなしデータの両方を擬似ラベル付け手法を用いて,よりよくデータ分布を推定できる半教師付き適応型ベイズ識別フレームワークを提案する。
提案手法は,適応的識別判別スキームを用いて識別時の情報損失を著しく低減し,分類器の識別能力を大幅に向上させる。
提案するrnb+,すなわち離散化フレームワークを用いた正規化ナイーブベイズは,幅広い機械学習データセット上で体系的に評価される。
最先端のNB分類器を著しく、一貫して上回る。
関連論文リスト
- DRoP: Distributionally Robust Pruning [11.930434318557156]
我々は、訓練されたモデルの分類バイアスにデータプルーニングが与える影響について、最初の系統的研究を行う。
そこで我々はDRoPを提案する。DRoPは,標準的なコンピュータビジョンベンチマークにおいて,その性能を実証的に実証し,分散的に頑健な手法である。
論文 参考訳(メタデータ) (2024-04-08T14:55:35Z) - Uncertainty-Based Extensible Codebook for Discrete Federated Learning in Heterogeneous Data Silos [11.443755718706562]
フェデレートラーニング(FL)は、大規模な分散データセットを活用することを目的としている。
従来の研究では、離散表現は小さな分布シフトをまたいだモデル一般化を促進するために研究されてきた。
FLから派生したモデルでは,不慣れな分布を持つデータサイロに適用した場合,不確実性が著しく向上することが確認できた。
論文 参考訳(メタデータ) (2024-02-29T06:13:10Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Boosting the Discriminant Power of Naive Bayes [17.43377106246301]
本稿では,スタックオートエンコーダを用いた特徴拡張手法を提案し,データ中のノイズを低減し,ベイズの識別力を高める。
実験結果から,提案手法は最先端のベイズ分類器よりも大きく,かつ一貫した性能を示した。
論文 参考訳(メタデータ) (2022-09-20T08:02:54Z) - A Max-relevance-min-divergence Criterion for Data Discretization with
Applications on Naive Bayes [22.079025650097932]
多くの分類モデルにおいて、データはその分布をより正確に推定するために離散化される。
本稿では,識別データの識別情報と一般化能力の両方を最大化する,MDmD(Max-Dependency-Min-Divergence)基準を提案する。
本稿では,各属性を別々に識別し,識別されたデータの識別情報と一般化能力を同時に最大化することにより,より実用的なMRMD(Max-Relevance-Min-Divergence)離散化手法を提案する。
論文 参考訳(メタデータ) (2022-09-20T07:45:00Z) - Adaptive Dimension Reduction and Variational Inference for Transductive
Few-Shot Classification [2.922007656878633]
適応次元の削減によりさらに改善された変分ベイズ推定に基づく新しいクラスタリング法を提案する。
提案手法は,Few-Shotベンチマークにおける現実的非バランスなトランスダクティブ設定の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-09-18T10:29:02Z) - Mitigating Algorithmic Bias with Limited Annotations [65.060639928772]
機密属性が公開されていない場合、バイアスを軽減するために、トレーニングデータの小さな部分を手動でアノテートする必要がある。
本稿では,アルゴリズムバイアスの影響を最大限に排除するために,限定アノテーションを誘導する対話型フレームワークであるアクティブペナライゼーション・オブ・差別(APOD)を提案する。
APODは完全なアノテートバイアス緩和と同等のパフォーマンスを示しており、機密情報が制限された場合、APODが現実世界のアプリケーションに利益をもたらすことを実証している。
論文 参考訳(メタデータ) (2022-07-20T16:31:19Z) - Augmentation-Aware Self-Supervision for Data-Efficient GAN Training [68.81471633374393]
識別器が過度に適合する傾向があるため、限られたデータでGANを訓練することは困難である。
本稿では,拡張データの拡張パラメータを予測する,拡張型自己教師型識別器を提案する。
本稿では,クラス条件の BigGAN と非条件の StyleGAN2 アーキテクチャを用いた State-of-the-art (SOTA) 手法と比較する。
論文 参考訳(メタデータ) (2022-05-31T10:35:55Z) - Reusing the Task-specific Classifier as a Discriminator:
Discriminator-free Adversarial Domain Adaptation [55.27563366506407]
非教師付きドメイン適応(UDA)のための識別器なし対向学習ネットワーク(DALN)を導入する。
DALNは、統一された目的によって明確なドメインアライメントとカテゴリの区別を達成する。
DALNは、さまざまなパブリックデータセット上の既存の最先端(SOTA)メソッドと比較して好意的に比較する。
論文 参考訳(メタデータ) (2022-04-08T04:40:18Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - On Positive-Unlabeled Classification in GAN [130.43248168149432]
本稿では,標準GANに対する肯定的かつ未ラベルの分類問題を定義する。
その後、GANにおける差別者の訓練を安定させる新しい手法が導かれる。
論文 参考訳(メタデータ) (2020-02-04T05:59:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。