論文の概要: Streaming algorithms for evaluating noisy judges on unlabeled data --
binary classification
- arxiv url: http://arxiv.org/abs/2306.01726v2
- Date: Thu, 22 Jun 2023 14:46:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 17:01:33.445281
- Title: Streaming algorithms for evaluating noisy judges on unlabeled data --
binary classification
- Title(参考訳): ラベルなしデータに基づく雑音判断のためのストリーミングアルゴリズム -バイナリ分類
- Authors: Andr\'es Corrada-Emmanuel
- Abstract要約: 我々は、代数的故障モードを用いて、ほぼ誤りのないトリオスを探索し、評価アンサンブルを過度に相関するものとして否定する。
生き残ったアンサンブルが生み出す結果は、時には1%にも達することがある。
独立性が仮定されるときに生じる推定値のテイラー展開は、実際、分類器はわずかに相関しているので、独立評価器が代数的盲点を持つかを明らかにするのに役立つ」。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of noisy binary classifiers on unlabeled data is treated as a
streaming task: given a data sketch of the decisions by an ensemble, estimate
the true prevalence of the labels as well as each classifier's accuracy on
them. Two fully algebraic evaluators are constructed to do this. Both are based
on the assumption that the classifiers make independent errors. The first is
based on majority voting. The second, the main contribution of the paper, is
guaranteed to be correct. But how do we know the classifiers are independent on
any given test? This principal/agent monitoring paradox is ameliorated by
exploiting the failures of the independent evaluator to return sensible
estimates. A search for nearly error independent trios is empirically carried
out on the \texttt{adult}, \texttt{mushroom}, and \texttt{two-norm} datasets by
using the algebraic failure modes to reject evaluation ensembles as too
correlated. The searches are refined by constructing a surface in evaluation
space that contains the true value point. The algebra of arbitrarily correlated
classifiers permits the selection of a polynomial subset free of any
correlation variables. Candidate evaluation ensembles are rejected if their
data sketches produce independent estimates too far from the constructed
surface. The results produced by the surviving ensembles can sometimes be as
good as 1\%. But handling even small amounts of correlation remains a
challenge. A Taylor expansion of the estimates produced when independence is
assumed but the classifiers are, in fact, slightly correlated helps clarify how
the independent evaluator has algebraic `blind spots'.
- Abstract(参考訳): ラベル付けされていないデータに対するノイズの多いバイナリ分類器の評価はストリーミングタスクとして扱われる: アンサンブルによる決定のデータのスケッチを与えられた場合、ラベルの真価と各分類器の精度を推定する。
2つの完全に代数的な評価器が構築されている。
どちらも、分類器が独立した誤りを犯すという仮定に基づいている。
1つ目は多数決による投票である。
論文の主な貢献である2番目は、正しいことが保証されている。
しかし、どのようなテストで分類器が独立であることをどうやって知るのか?
このプリンシパル/エージェント監視パラドックスは、独立評価器の故障を利用して、合理的な見積を返すことで改善される。
ほぼエラーのない三重項の探索は、代数的故障モードを用いて、不相関な評価アンサンブルを拒絶することで、 \texttt{adult}, \texttt{mushroom}, \texttt{two-norm}データセット上で経験的に実行される。
真の値点を含む評価空間の表面を構築することにより、検索を洗練する。
任意の相関変数を含まない多項式部分集合の選択を任意の相関型分類器の代数は許す。
候補評価アンサンブルは、データスケッチが構築面から遠すぎる独立した推定値を生成する場合、拒否される。
生き残ったアンサンブルが生み出す結果は、時には1\%にも達することがある。
しかし、少量の相関を扱うことは依然として困難である。
独立性が仮定されるときに生成される推定値のテイラー展開は、実際、分類器はわずかに相関しており、独立評価器が代数的「盲点」を持つかを明らかにするのに役立つ。
関連論文リスト
- Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Counterfactually Comparing Abstaining Classifiers [37.43975777164451]
保持された分類器は、不確実な入力の予測を控えるオプションがある。
そこで本稿では, 留意点を欠落データとして扱うことによって, 留意点の評価と比較を行う新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-17T20:46:57Z) - Label-Noise Learning with Intrinsically Long-Tailed Data [65.41318436799993]
本稿では,本質的な長期データを用いたラベルノイズ学習のための学習フレームワークを提案する。
具体的には, 2段階の2次元試料選択法(TABASCO)を提案する。
論文 参考訳(メタデータ) (2022-08-21T07:47:05Z) - Learning from Multiple Unlabeled Datasets with Partial Risk
Regularization [80.54710259664698]
本稿では,クラスラベルを使わずに正確な分類器を学習することを目的とする。
まず、与えられたラベルのない集合から推定できる分類リスクの偏りのない推定器を導出する。
その結果、経験的リスクがトレーニング中に負になるにつれて、分類器が過度に適合する傾向があることが判明した。
実験により,本手法は,複数の未ラベル集合から学習する最先端の手法を効果的に緩和し,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-07-04T16:22:44Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Specialists Outperform Generalists in Ensemble Classification [15.315432841707736]
本稿では,アンサンブルの精度を判定できるかどうかという問題に対処する。
我々は、上と下の境界に達する個別の分類器を明示的に構築する:専門家と一般主義者。
論文 参考訳(メタデータ) (2021-07-09T12:16:10Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Evaluating Fairness of Machine Learning Models Under Uncertain and
Incomplete Information [25.739240011015923]
属性分類器のテスト精度は下流モデルにおけるバイアス推定の有効性と常に相関しているとは限らない。
我々の分析は,属性分類器の誤りを可能な限り不均一に分配したいという状況において,意外かつ直感的な意味を持っている。
論文 参考訳(メタデータ) (2021-02-16T19:02:55Z) - Verifying Individual Fairness in Machine Learning Models [4.29921861868687]
我々は、構造化されたデータを扱う決定モデルが、個別の公平性を持つかどうかという問題を考察する。
我々の目的は、与えられたモデルの個々人の公正性を証明するための検証器を構築することである。
論文 参考訳(メタデータ) (2020-06-21T08:37:54Z) - Classifier-independent Lower-Bounds for Adversarial Robustness [13.247278149124757]
理論的には、テストタイムの逆数と雑音の分類例に対するロバスト性の限界を解析する。
最適輸送理論を用いて、与えられた分類問題に対して分類器ができるベイズ最適誤差の変分式を導出する。
一般的な距離ベース攻撃の場合,ベイズ最適誤差に対して明らかな下限を導出する。
論文 参考訳(メタデータ) (2020-06-17T16:46:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。