論文の概要: A Unified View of Label Shift Estimation
- arxiv url: http://arxiv.org/abs/2003.07554v3
- Date: Fri, 16 Oct 2020 19:23:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:38:03.233542
- Title: A Unified View of Label Shift Estimation
- Title(参考訳): ラベルシフト推定の統一的視点
- Authors: Saurabh Garg, Yifan Wu, Sivaraman Balakrishnan, Zachary C. Lipton
- Abstract要約: ラベルの限界を推定する2つの主要なアプローチがある。
本稿では,2つの手法の統一的な視点とMLLSの理論的特徴について述べる。
我々の分析は、BBSEの統計的非効率性は、粗い校正による情報の喪失に起因している。
- 参考スコア(独自算出の注目度): 45.472049320861856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Under label shift, the label distribution p(y) might change but the
class-conditional distributions p(x|y) do not. There are two dominant
approaches for estimating the label marginal. BBSE, a moment-matching approach
based on confusion matrices, is provably consistent and provides interpretable
error bounds. However, a maximum likelihood estimation approach, which we call
MLLS, dominates empirically. In this paper, we present a unified view of the
two methods and the first theoretical characterization of MLLS. Our
contributions include (i) consistency conditions for MLLS, which include
calibration of the classifier and a confusion matrix invertibility condition
that BBSE also requires; (ii) a unified framework, casting BBSE as roughly
equivalent to MLLS for a particular choice of calibration method; and (iii) a
decomposition of MLLS's finite-sample error into terms reflecting
miscalibration and estimation error. Our analysis attributes BBSE's statistical
inefficiency to a loss of information due to coarse calibration. Experiments on
synthetic data, MNIST, and CIFAR10 support our findings.
- Abstract(参考訳): ラベルシフトの下では、ラベル分布 p(y) は変化するが、クラス条件分布 p(x|y) は変化しない。
ラベルの限界を推定する2つの主要なアプローチがある。
BBSEは、混乱行列に基づくモーメントマッチングアプローチであり、確実に一貫性があり、解釈可能なエラー境界を提供する。
しかし、MLLSと呼ばれる最大推定手法は経験的に支配的である。
本稿では,2つの手法の統一的な視点とMLLSの理論的特徴について述べる。
私たちの貢献には
(i)分類器の校正及びbbseが要求する混乱行列可逆条件を含むmllの一貫性条件
(二)特定の校正方法の選択において、BBSEをMLLSと略同値に鋳造する統一的な枠組み、及び
3)MLLSの有限サンプル誤差を誤校正と推定誤差を反映した用語に分解する。
我々の分析は、BBSEの統計的非効率性は、粗い校正による情報の喪失に起因している。
合成データ,MNIST,CIFAR10の実験は,この結果を支持する。
関連論文リスト
- SoftCVI: Contrastive variational inference with self-generated soft labels [2.5398014196797614]
変分推論とマルコフ連鎖モンテカルロ法がこのタスクの主要なツールである。
ソフトコントラスト変動推論(SoftCVI)を導入し、コントラスト推定フレームワークを用いて変動対象のファミリーを導出する。
我々は、SoftCVIを用いて、訓練や大量発見に安定な目標を定式化することができ、他の変分アプローチよりも頻繁に優れた推論が可能であることを発見した。
論文 参考訳(メタデータ) (2024-07-22T14:54:12Z) - Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0]
この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文 参考訳(メタデータ) (2023-08-30T13:26:49Z) - How Does Pseudo-Labeling Affect the Generalization Error of the
Semi-Supervised Gibbs Algorithm? [73.80001705134147]
擬似ラベル付き半教師付き学習(SSL)におけるGibsアルゴリズムによる予測一般化誤差(ゲンエラー)を正確に評価する。
ゲンエラーは、出力仮説、擬ラベルデータセット、ラベル付きデータセットの間の対称性付きKL情報によって表現される。
論文 参考訳(メタデータ) (2022-10-15T04:11:56Z) - Algorithmic Fairness Verification with Graphical Models [24.8005399877574]
本稿では,ベイズネットワークのような特徴間の相関を符号化する,FVGMと呼ばれる効率の良いフェアネス検証手法を提案する。
FVGMは、より多様なフェアネス向上アルゴリズムのファミリーに対して、正確でスケーラブルな評価をもたらすことを示す。
論文 参考訳(メタデータ) (2021-09-20T12:05:14Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z) - Label-Imbalanced and Group-Sensitive Classification under
Overparameterization [32.923780772605596]
ラベルの不均衡でグループに敏感な分類は、関連するメトリクスを最適化するための標準トレーニングアルゴリズムを適切に修正することを目指す。
標準実証的リスク最小化に対するロジット調整による損失修正は,一般的には効果がない可能性がある。
本研究では, 2つの共通する不均衡(ラベル/グループ)を統一的に処理し, 敏感群の二値分類に自然に適用できることを示した。
論文 参考訳(メタデータ) (2021-03-02T08:09:43Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - Distribution Aligning Refinery of Pseudo-label for Imbalanced
Semi-supervised Learning [126.31716228319902]
Pseudo-label (DARP) アルゴリズムの分散アライメント・リファナリーを開発する。
DARPは最先端のSSLスキームと有効かつ効率的に互換性があることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:16:05Z) - Dual T: Reducing Estimation Error for Transition Matrix in Label-noise
Learning [157.2709657207203]
遷移行列を推定する既存の方法は、ノイズのあるクラス後部を推定することに大きく依存している。
雑音のクラス後部を直接推定するのを避けるために中間クラスを導入する。
この中間クラスにより、元の遷移行列は2つの容易に推定できる遷移行列の積に分解できる。
論文 参考訳(メタデータ) (2020-06-14T05:48:20Z) - Estimation of Classification Rules from Partially Classified Data [0.9137554315375919]
本研究は, 試料に起源のクラスが知られている観察結果と, 試料中の残りの観察結果が未分類である状況について考察する。
未知パラメータのベクトルまで既知のクラス条件分布の場合、次の未分類観測の割り当てに対するベイズの割り当て規則を推定することが目的である。
論文 参考訳(メタデータ) (2020-04-13T23:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。