論文の概要: A Minimax Probability Machine for Non-Decomposable Performance Measures
- arxiv url: http://arxiv.org/abs/2103.00396v1
- Date: Sun, 28 Feb 2021 04:58:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 22:58:39.891737
- Title: A Minimax Probability Machine for Non-Decomposable Performance Measures
- Title(参考訳): 非可逆性能測定のためのミニマックス確率機械
- Authors: Junru Luo, Hong Qiao and Bo Zhang
- Abstract要約: 不均衡な分類タスクは多くの現実世界のアプリケーションで広く使われている。
minimax確率機械はバイナリ分類問題の一般的な方法である。
本稿では,不均衡な分類タスクを扱うために使用できる,$f_beta$測度のための新しい minimax 確率マシン mpmf を開発した。
- 参考スコア(独自算出の注目度): 15.288802707471792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Imbalanced classification tasks are widespread in many real-world
applications. For such classification tasks, in comparison with the accuracy
rate, it is usually much more appropriate to use non-decomposable performance
measures such as the Area Under the receiver operating characteristic Curve
(AUC) and the $F_\beta$ measure as the classification criterion since the label
class is imbalanced. On the other hand, the minimax probability machine is a
popular method for binary classification problems and aims at learning a linear
classifier by maximizing the accuracy rate, which makes it unsuitable to deal
with imbalanced classification tasks. The purpose of this paper is to develop a
new minimax probability machine for the $F_\beta$ measure, called MPMF, which
can be used to deal with imbalanced classification tasks. A brief discussion is
also given on how to extend the MPMF model for several other non-decomposable
performance measures listed in the paper. To solve the MPMF model effectively,
we derive its equivalent form which can then be solved by an alternating
descent method to learn a linear classifier. Further, the kernel trick is
employed to derive a nonlinear MPMF model to learn a nonlinear classifier.
Several experiments on real-world benchmark datasets demonstrate the
effectiveness of our new model.
- Abstract(参考訳): 不均衡な分類タスクは多くの現実世界のアプリケーションで広く使われている。
このような分類タスクでは、精度と比べ、レシーバ動作特性曲線(AUC)のエリアやラベルクラスが不均衡であるため、$F_\beta$測定などの非分解不能な性能測定を分類基準として使うのが適当である。
一方,ミニマックス確率機械は二項分類問題に対する一般的な手法であり,精度を最大化して線形分類器の学習を目的としており,不均衡な分類タスクに対処するには不適当である。
本論文の目的は, 分類の不均衡な処理に用いることができるMPMFと呼ばれる$F_\beta$測度のための新しいミニマックス確率機械を開発することである。
また、MPMFモデルをいくつかの非分解性性能指標に拡張する方法についても簡単な議論がなされている。
mpmfモデルを効果的に解くために、交互降下法で解くことのできる等価な形式を導出して線形分類器を学習する。
さらに、カーネルトリックを用いて非線形MPMFモデルを導出し、非線形分類器を学習する。
実世界のベンチマークデータセットに関するいくつかの実験は、新しいモデルの有効性を示しています。
関連論文リスト
- Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Smooth Ranking SVM via Cutting-Plane Method [6.946903076677842]
我々は,AUCを最大化するために,Randing SVMと類似した切削平面法に依存するプロトタイプ学習手法を開発した。
本アルゴリズムは,切削面を反復的に導入することで,より単純なモデルを学ぶ。
73のバイナリ分類データセットを用いて行った実験から,本手法は競合する25のデータセットの中で最高のAUCが得られる。
論文 参考訳(メタデータ) (2024-01-25T18:47:23Z) - MISS: Multiclass Interpretable Scoring Systems [13.902264070785986]
MISS(Multiclass Interpretable Scoring Systems)構築のための機械学習手法を提案する。
MISSは、シングルクラス、スパース、ユーザフレンドリーなスコアリングシステムのための、完全なデータ駆動の方法論である。
結果から,本手法は他の機械学習モデルと性能指標の分類において競合し,高い校正率のクラス確率が得られたことが示唆された。
論文 参考訳(メタデータ) (2024-01-10T10:57:12Z) - Cost-sensitive probabilistic predictions for support vector machines [1.743685428161914]
サポートベクターマシン(SVM)は広く使われており、最もよく検討され使用されている機械学習モデルの一つである。
本稿では,SVMの確率的出力を生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-09T11:00:17Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - PLM: Partial Label Masking for Imbalanced Multi-label Classification [59.68444804243782]
長いラベルの分布を持つ実世界のデータセットで訓練されたニューラルネットワークは、頻繁なクラスに偏りがあり、頻繁なクラスでは不十分である。
本稿では,この比率を利用したPLM(Partial Label Masking)を提案する。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100) の2つの画像分類データセットにおいて,既存の手法と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-05-22T18:07:56Z) - Risk Bounds for Over-parameterized Maximum Margin Classification on
Sub-Gaussian Mixtures [100.55816326422773]
線形分類問題に対する最大マージン分類器の現象について検討する。
その結果、良性的なオーバーフィットが起きる条件を正確に特徴づけます。
論文 参考訳(メタデータ) (2021-04-28T08:25:16Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Unbiased Subdata Selection for Fair Classification: A Unified Framework
and Scalable Algorithms [0.8376091455761261]
このフレームワーク内の多くの分類モデルが混合整数凸プログラムとして再キャストできることを示した。
そして,提案問題において,分類結果の「解決不能な部分データ選択」が強く解決可能であることを示す。
これにより、分類インスタンスを解決するための反復精錬戦略(IRS)の開発を動機付けます。
論文 参考訳(メタデータ) (2020-12-22T21:09:38Z) - Bayesian Few-Shot Classification with One-vs-Each P\'olya-Gamma
Augmented Gaussian Processes [7.6146285961466]
FSC(Few-shot Classification)は、人間のような機械学習への道のりの重要なステップである。
P'olya-Gamma augmentation と one-vs-each softmax approximation の新たな組み合わせを提案する。
標準的な数ショット分類ベンチマークと数ショットドメイン転送タスクの両方において、精度の向上と不確かさの定量化を実証した。
論文 参考訳(メタデータ) (2020-07-20T19:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。