論文の概要: Can I Trust My Fairness Metric? Assessing Fairness with Unlabeled Data
and Bayesian Inference
- arxiv url: http://arxiv.org/abs/2010.09851v1
- Date: Mon, 19 Oct 2020 20:42:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 20:11:07.231554
- Title: Can I Trust My Fairness Metric? Assessing Fairness with Unlabeled Data
and Bayesian Inference
- Title(参考訳): フェアネス・メトリックを信用できますか?
ラベルなしデータとベイズ推定による公平性の評価
- Authors: Disi Ji, Padhraic Smyth, Mark Steyvers
- Abstract要約: ラベル付き例はほとんどないがラベル付き例が豊富である場合に,グループフェアネスを確実に評価する問題について検討する。
本稿では,ラベル付きデータをラベル付きデータで拡張し,より正確で分散度の低い推定値を生成する一般ベイズフレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.801569177127885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the problem of reliably assessing group fairness when labeled
examples are few but unlabeled examples are plentiful. We propose a general
Bayesian framework that can augment labeled data with unlabeled data to produce
more accurate and lower-variance estimates compared to methods based on labeled
data alone. Our approach estimates calibrated scores for unlabeled examples in
each group using a hierarchical latent variable model conditioned on labeled
examples. This in turn allows for inference of posterior distributions with
associated notions of uncertainty for a variety of group fairness metrics. We
demonstrate that our approach leads to significant and consistent reductions in
estimation error across multiple well-known fairness datasets, sensitive
attributes, and predictive models. The results show the benefits of using both
unlabeled data and Bayesian inference in terms of assessing whether a
prediction model is fair or not.
- Abstract(参考訳): ラベル付き例が少ないがラベル付き例が豊富である場合の集団公平性を確実に評価する問題について検討する。
ラベルなしデータでラベル付きデータを拡張し,ラベル付きデータのみに基づく手法と比較して,より正確かつ低分散な推定を生成する汎用ベイズフレームワークを提案する。
提案手法は,ラベル付き例に条件付き階層型潜在変数モデルを用いて,各グループにおけるラベルなし例の校正スコアを推定する。
これにより、様々なグループフェアネスメトリクスに対する不確実性の概念と関連した後方分布の推測が可能になる。
提案手法は,複数のよく知られたフェアネスデータセット,センシティブ属性,予測モデルにおいて,推定誤差の大幅な,一貫した低減につながることを示す。
その結果,予測モデルが公平であるか否かを評価する上で,ラベルなしのデータとベイズ推論の両方を使用することの利点が示された。
関連論文リスト
- Self Adaptive Threshold Pseudo-labeling and Unreliable Sample Contrastive Loss for Semi-supervised Image Classification [6.920336485308536]
擬似ラベルに基づく半教師付きアプローチは、画像分類において2つの問題に悩まされる。
我々は,各クラスの閾値を動的に調整し,信頼性の高いサンプル数を増やす自己適応型閾値擬似ラベル戦略を開発した。
しきい値以下でラベル付けされていないデータを効果的に活用するために、信頼できないサンプルコントラスト損失を提案する。
論文 参考訳(メタデータ) (2024-07-04T03:04:56Z) - Leveraging Ensemble Diversity for Robust Self-Training in the Presence of Sample Selection Bias [5.698050337128548]
半教師付き学習において、自己学習はよく知られたアプローチである。モデルが自信を持ってラベル付きデータに擬似ラベルを反復的に割り当て、ラベル付き例として扱う。
ニューラルネットワークの場合、ソフトマックス予測確率はしばしば信頼度尺度として使用されるが、誤った予測であっても過度に信頼されていることが知られている。
本稿では,線形分類器のアンサンブルの予測多様性に基づいて,$mathcalT$-similarityと呼ばれる新しい信頼度尺度を提案する。
論文 参考訳(メタデータ) (2023-10-23T11:30:06Z) - Binary Classification with Confidence Difference [100.08818204756093]
本稿では,信頼性差分法 (ConfDiff) という,弱教師付き二項分類問題について考察する。
本稿では,この問題に対処するためのリスク一貫性のあるアプローチを提案し,推定誤差が最適収束率と一致することを示す。
また,整合性や収束率も証明されたオーバーフィッティング問題を緩和するためのリスク補正手法も導入する。
論文 参考訳(メタデータ) (2023-10-09T11:44:50Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Gray Learning from Non-IID Data with Out-of-distribution Samples [45.788789553551176]
専門家が注釈を付けたとしても、トレーニングデータの完全性は保証されていない。
我々は,基本真実と相補的ラベルを両立させる新しいアプローチであるtextitGray Learningを導入する。
統計学習理論における我々のアプローチを基礎として、一般化誤差の境界を導出し、GLが非IID設定でも厳密な制約を達成できることを実証する。
論文 参考訳(メタデータ) (2022-06-19T10:46:38Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - Dash: Semi-Supervised Learning with Dynamic Thresholding [72.74339790209531]
我々は、ラベルのない例を使ってモデルをトレーニングする半教師付き学習(SSL)アプローチを提案する。
提案手法であるDashは、ラベルなしデータ選択の観点から適応性を享受する。
論文 参考訳(メタデータ) (2021-09-01T23:52:29Z) - Comparing the Value of Labeled and Unlabeled Data in Method-of-Moments
Latent Variable Estimation [17.212805760360954]
我々は,メソッド・オブ・モーメント・潜在変数推定におけるモデル誤特定に着目したフレームワークを用いている。
そして、ある場合においてこのバイアスを確実に排除する補正を導入する。
理論上, 合成実験により, 特定されたモデルではラベル付点がラベル付点以上の定数に値することを示した。
論文 参考訳(メタデータ) (2021-03-03T23:52:38Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z) - Robust and On-the-fly Dataset Denoising for Image Classification [72.10311040730815]
On-the-fly Data Denoising (ODD)は、間違ったラベルの例に対して堅牢だが、通常のトレーニングと比べて計算オーバーヘッドはほぼゼロである。
ODDはWebVisionやClothing1Mといった現実世界のデータセットを含む、幅広いデータセットで最先端の結果を達成することができる。
論文 参考訳(メタデータ) (2020-03-24T03:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。