論文の概要: On support vector machines under a multiple-cost scenario
- arxiv url: http://arxiv.org/abs/2312.14795v1
- Date: Fri, 22 Dec 2023 16:12:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-25 14:29:04.037616
- Title: On support vector machines under a multiple-cost scenario
- Title(参考訳): マルチコストシナリオにおけるサポートベクトルマシンについて
- Authors: Sandra Ben\'itez-Pe\~na and Rafael Blanquero and Emilio Carrizosa and
Pepa Ram\'irez-Cobo
- Abstract要約: Support Vector Machine (SVM) はバイナリ分類において強力なツールである。
本稿では,性能制約を組み込んだ誤り分類コストを考慮した新しいSVMモデルを提案する。
- 参考スコア(独自算出の注目度): 1.743685428161914
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Support Vector Machine (SVM) is a powerful tool in binary classification,
known to attain excellent misclassification rates. On the other hand, many
realworld classification problems, such as those found in medical diagnosis,
churn or fraud prediction, involve misclassification costs which may be
different in the different classes. However, it may be hard for the user to
provide precise values for such misclassification costs, whereas it may be much
easier to identify acceptable misclassification rates values. In this paper we
propose a novel SVM model in which misclassification costs are considered by
incorporating performance constraints in the problem formulation. Specifically,
our aim is to seek the hyperplane with maximal margin yielding
misclassification rates below given threshold values. Such maximal margin
hyperplane is obtained by solving a quadratic convex problem with linear
constraints and integer variables. The reported numerical experience shows that
our model gives the user control on the misclassification rates in one class
(possibly at the expense of an increase in misclassification rates for the
other class) and is feasible in terms of running times.
- Abstract(参考訳): Support Vector Machine(SVM)はバイナリ分類において強力なツールであり、優れた誤分類率を持つことで知られている。
一方、医学診断、チャーン、詐欺予測などの現実世界の分類問題の多くは、異なるクラスで異なる可能性のある誤分類コストを伴っている。
しかし、そのような誤分類コストに対して正確な値を提供することは困難であり、許容できる誤分類率を識別することがより容易である。
本稿では,問題定式化に性能制約を組み込むことで,誤分類コストを考慮した新しいSVMモデルを提案する。
具体的には,最大辺が与えられた閾値以下の誤分類率を有する超平面を求める。
そのような最大辺超平面は、線形制約と整数変数を持つ二次凸問題を解くことによって得られる。
報告された数値的経験から、我々のモデルは、あるクラスにおける誤分類率(おそらく他のクラスにおける誤分類率の増加による)をユーザが制御でき、実行時間の観点からも実現可能であることを示す。
関連論文リスト
- Wasserstein Distributionally Robust Multiclass Support Vector Machine [1.8570591025615457]
データの特徴が $mathbfx$ であり,そのラベルが $mathbfy$ であるような設定におけるマルチクラス分類の問題について検討する。
我々は、分散ロバストな最適化を用いて、クラマー・シンガー(CS)損失を特徴とするマルチクラスサポートベクターマシン(SVM)のロバストバージョンを開発する。
我々の数値実験は、トレーニングデータが高度に不均衡な環境で、我々のモデルが最先端のOVAモデルより優れていることを示す。
論文 参考訳(メタデータ) (2024-09-12T21:40:04Z) - Cost-sensitive Feature Selection for Support Vector Machines [1.743685428161914]
本稿では,最も一般的な分類手法の一つであるSupport Vector Machinesに組込み,数学的最適化に基づく特徴選択手法を提案する。
また, 偽陰性率と偽陰性率とのトレードオフが望まれる一方で, 特徴量を大幅に減少することを示す。
論文 参考訳(メタデータ) (2024-01-15T12:07:52Z) - Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。
本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。
そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-07T18:37:43Z) - Probabilistic Safety Regions Via Finite Families of Scalable Classifiers [2.431537995108158]
監視された分類は、データのパターンを認識して、振る舞いのクラスを分離する。
正準解は、機械学習の数値近似の性質に固有の誤分類誤差を含む。
本稿では,確率論的安全性領域の概念を導入し,入力空間のサブセットとして,誤分類されたインスタンスの数を確率論的に制御する手法を提案する。
論文 参考訳(メタデータ) (2023-09-08T22:40:19Z) - Online Selective Classification with Limited Feedback [82.68009460301585]
オンライン学習モデルにおいて、予測者がインスタンスの分類を控える可能性のある選択的分類について検討する。
私たちが考慮している設定の健全な2つの側面は、データが不可避である可能性があるため、データは不可避である可能性があるということです。
smash$tildeO(T1-mu)$ over abstention against Adaptive adversaries. smash$tildeO(T1-mu)$ incurring smash$tildeO(T1-mu)$ over abstention。
論文 参考訳(メタデータ) (2021-10-27T08:00:53Z) - Learning Gaussian Mixtures with Generalised Linear Models: Precise
Asymptotics in High-dimensions [79.35722941720734]
多クラス分類問題に対する一般化線形モデルは、現代の機械学習タスクの基本的な構成要素の1つである。
実験的リスク最小化による高次元推定器の精度を実証する。
合成データの範囲を超えて我々の理論をどのように適用できるかを論じる。
論文 参考訳(メタデータ) (2021-06-07T16:53:56Z) - Risk Bounds for Over-parameterized Maximum Margin Classification on
Sub-Gaussian Mixtures [100.55816326422773]
線形分類問題に対する最大マージン分類器の現象について検討する。
その結果、良性的なオーバーフィットが起きる条件を正確に特徴づけます。
論文 参考訳(メタデータ) (2021-04-28T08:25:16Z) - A Minimax Probability Machine for Non-Decomposable Performance Measures [15.288802707471792]
不均衡な分類タスクは多くの現実世界のアプリケーションで広く使われている。
minimax確率機械はバイナリ分類問題の一般的な方法である。
本稿では,不均衡な分類タスクを扱うために使用できる,$f_beta$測度のための新しい minimax 確率マシン mpmf を開発した。
論文 参考訳(メタデータ) (2021-02-28T04:58:46Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Angle-Based Cost-Sensitive Multicategory Classification [34.174072286426885]
本稿では,ゼロ対ゼロの制約を伴わない多カテゴリ分類のための,新しいアングルに基づくコスト依存分類フレームワークを提案する。
このフレームワークの有用性を示すために、2つのコスト依存型マルチカテゴリブースティングアルゴリズムを具体例として導出した。
論文 参考訳(メタデータ) (2020-03-08T00:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。