論文の概要: Classification with Trust: A Supervised Approach based on Sequential
Ellipsoidal Partitioning
- arxiv url: http://arxiv.org/abs/2302.10487v1
- Date: Tue, 21 Feb 2023 07:29:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 16:07:46.881038
- Title: Classification with Trust: A Supervised Approach based on Sequential
Ellipsoidal Partitioning
- Title(参考訳): 信頼による分類:逐次楕円分割に基づく教師付きアプローチ
- Authors: Ranjani Niranjan and Sachit Rao
- Abstract要約: 本稿では,データセットを複数の楕円体に順次分割する凸最適化に基づく教師付き分類器を提案する。
この分割に基づいて分類規則を記述することにより、ベイズの公式を適用して、信頼スコアをテストデータポイントに計算する。
提案したSequential Ellipsoidal Partitioning Classifier (SEP-C)は、別の探索データ解析を必要とせずに、データセットの不規則を露呈する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard metrics of performance of classifiers, such as accuracy and
sensitivity, do not reveal the trust or confidence in the predicted labels of
data. While other metrics such as the computed probability of a label or the
signed distance from a hyperplane can act as a trust measure, these are
subjected to heuristic thresholds. This paper presents a convex
optimization-based supervised classifier that sequentially partitions a dataset
into several ellipsoids, where each ellipsoid contains nearly all points of the
same label. By stating classification rules based on this partitioning, Bayes'
formula is then applied to calculate a trust score to a label assigned to a
test datapoint determined from these rules. The proposed Sequential Ellipsoidal
Partitioning Classifier (SEP-C) exposes dataset irregularities, such as degree
of overlap, without requiring a separate exploratory data analysis. The rules
of classification, which are free of hyperparameters, are also not affected by
class-imbalance, the underlying data distribution, or number of features. SEP-C
does not require the use of non-linear kernels when the dataset is not linearly
separable. The performance, and comparison with other methods, of SEP-C is
demonstrated on the XOR-problem, circle dataset, and other open-source
datasets.
- Abstract(参考訳): 精度や感度などの分類器の性能の標準指標は、予測されたデータラベルの信頼性や信頼性を明らかにしない。
ラベルの計算された確率や超平面からの符号付き距離といった他の指標は信頼度として機能するが、これらはヒューリスティックしきい値となる。
本稿では,複数の楕円体にデータセットを逐次分割する凸最適化に基づく教師付き分類器を提案する。
この分割に基づく分類規則を述べることにより、ベイズの公式を適用し、これらの規則から決定されるテストデータポイントに割り当てられたラベルに信頼スコアを計算する。
提案したSequential Ellipsoidal Partitioning Classifier (SEP-C)は、別の探索データ解析を必要とせず、重複度などのデータセットの不規則を露呈する。
ハイパーパラメータを含まない分類規則は、クラス不均衡、基礎となるデータ分布、特徴数の影響を受けない。
SEP-Cは、データセットが線形分離可能でない場合、非線形カーネルの使用を必要としない。
SEP-Cの性能および他の方法との比較は、XOR-problem、サークルデータセット、その他のオープンソースデータセット上で実証される。
関連論文リスト
- A Debiased Nearest Neighbors Framework for Multi-Label Text Classification [13.30576550077694]
マルチラベルテキスト分類(MLTC)のためのDebiased Nearest Neighbors(DENN)フレームワークについて紹介する。
組込みアライメントバイアスに対処するために,ラベル共起における近傍の一貫性を向上する,非バイアス付きコントラスト学習戦略を提案する。
信頼度推定バイアスには,$k$NNの予測と帰納的二分分類の適応的組み合わせを改善し,偏りのある信頼度推定戦略を提案する。
論文 参考訳(メタデータ) (2024-08-06T14:00:23Z) - PAC Prediction Sets Under Label Shift [52.30074177997787]
予測セットは、個々のラベルではなくラベルのセットを予測することによって不確実性を捉える。
ラベルシフト設定においてPAC保証付き予測セットを構築するための新しいアルゴリズムを提案する。
提案手法を5つのデータセットで評価する。
論文 参考訳(メタデータ) (2023-10-19T17:57:57Z) - Leveraging Structure for Improved Classification of Grouped Biased Data [8.121462458089143]
データポイントが自然にグループ化されるアプリケーションに対する半教師付きバイナリ分類を検討する。
我々は、この構造を明示的に活用し、最適、グループ対応、確率出力の分類器を学習する半教師付きアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-12-07T15:18:21Z) - Contrastive Credibility Propagation for Reliable Semi-Supervised Learning [6.014538614447467]
逐次的擬似ラベルリファインメントによる深部SSLのためのコントラストCCP(Contrastive Credibility Propagation)を提案する。
CCPは、教師付きベースラインをデータシナリオで確実に上回るために、半教師付き学習とノイズの多いラベル学習を統一する。
論文 参考訳(メタデータ) (2022-11-17T23:01:47Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Multi-label Classification via Adaptive Resonance Theory-based
Clustering [9.58897929546191]
本稿では,適応共振理論(art)に基づくクラスタリングアルゴリズムとラベル確率計算のためのベイズ法を適用し,連続学習が可能なマルチラベル分類アルゴリズムを提案する。
合成および実世界のマルチラベルデータセットを用いた実験結果は,提案アルゴリズムが他のよく知られたアルゴリズムと競合する分類性能を持つことを示した。
論文 参考訳(メタデータ) (2021-03-02T06:51:41Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z) - Cautious Active Clustering [79.23797234241471]
ユークリッド空間上の未知の確率測度からサンプリングされた点の分類の問題を考える。
我々のアプローチは、未知の確率測度を、各クラスに対する条件付き確率の凸結合として考えることである。
論文 参考訳(メタデータ) (2020-08-03T23:47:31Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。