論文の概要: Robust Fairness-aware Learning Under Sample Selection Bias
- arxiv url: http://arxiv.org/abs/2105.11570v1
- Date: Mon, 24 May 2021 23:23:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 06:08:49.008017
- Title: Robust Fairness-aware Learning Under Sample Selection Bias
- Title(参考訳): サンプル選択バイアス下におけるロバストフェアネスアウェア学習
- Authors: Wei Du and Xintao Wu
- Abstract要約: サンプル選択バイアス下での頑健で公正な学習のための枠組みを提案する。
テストデータが利用可能で、利用できない場合に、サンプル選択バイアスを処理する2つのアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 17.09665420515772
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The underlying assumption of many machine learning algorithms is that the
training data and test data are drawn from the same distributions. However, the
assumption is often violated in real world due to the sample selection bias
between the training and test data. Previous research works focus on reweighing
biased training data to match the test data and then building classification
models on the reweighed training data. However, how to achieve fairness in the
built classification models is under-explored. In this paper, we propose a
framework for robust and fair learning under sample selection bias. Our
framework adopts the reweighing estimation approach for bias correction and the
minimax robust estimation approach for achieving robustness on prediction
accuracy. Moreover, during the minimax optimization, the fairness is achieved
under the worst case, which guarantees the model's fairness on test data. We
further develop two algorithms to handle sample selection bias when test data
is both available and unavailable. We conduct experiments on two real-world
datasets and the experimental results demonstrate its effectiveness in terms of
both utility and fairness metrics.
- Abstract(参考訳): 多くの機械学習アルゴリズムの基本的な前提は、トレーニングデータとテストデータが同じ分布から引き出されることである。
しかし、この仮定はトレーニングデータとテストデータの間のサンプル選択バイアスのため、実世界ではしばしば破られる。
これまでの研究は、バイアスのあるトレーニングデータを改良し、テストデータにマッチさせ、強化されたトレーニングデータに基づいて分類モデルを構築することに焦点を当てている。
しかし、構築された分類モデルの公平性をどのように達成するかは未定である。
本稿では,サンプル選択バイアス下でのロバストで公平な学習の枠組みを提案する。
本フレームワークは, 偏差補正のための回帰推定手法と, 予測精度に頑健性を実現するための最小ロバスト推定手法を採用する。
さらに、最小限の最適化では、テストデータに対するモデルの公平性を保証する最悪の場合において、フェアネスが達成される。
テストデータが利用可能で利用できない場合、サンプル選択バイアスを処理する2つのアルゴリズムを更に開発する。
2つの実世界のデータセットについて実験を行い,実効性と公平性指標の両方の観点からその効果を実証した。
関連論文リスト
- Debiased Sample Selection for Combating Noisy Labels [24.296451733127956]
サンプル選択におけるバイアス学習のためのnoIse-Tolerant Expert Model (ITEM)を提案する。
具体的には、トレーニングバイアスを軽減するために、複数の専門家と統合した堅牢なネットワークアーキテクチャを設計します。
2つのクラス識別型ミニバッチの混合によるトレーニングにより、モデルが不均衡なトレーニングセットの効果を緩和する。
論文 参考訳(メタデータ) (2024-01-24T10:37:28Z) - Provable Detection of Propagating Sampling Bias in Prediction Models [1.7709344190822935]
本稿では,データバイアスの特定の形式である差分サンプリングバイアスが,データステージから予測ステージにどのように伝播するかを理論的に分析する。
妥当な仮定の下では、モデル予測におけるバイアスの量が、データの差分サンプリングバイアスの量の関数としてどのように変化するかを定量化する。
仮定が緩和された場合でも理論的な結果が実際に成り立つことを実証する。
論文 参考訳(メタデータ) (2023-02-13T23:39:35Z) - Revisiting Long-tailed Image Classification: Survey and Benchmarks with
New Evaluation Metrics [88.39382177059747]
メトリクスのコーパスは、長い尾の分布で学習するアルゴリズムの正確性、堅牢性、およびバウンダリを測定するために設計されている。
ベンチマークに基づいて,CIFAR10およびCIFAR100データセット上での既存手法の性能を再評価する。
論文 参考訳(メタデータ) (2023-02-03T02:40:54Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z) - Feature-Level Debiased Natural Language Understanding [86.8751772146264]
既存の自然言語理解(NLU)モデルは、特定のデータセットで高いパフォーマンスを達成するために、データセットバイアスに依存することが多い。
本稿では, バイアスの潜在特性を緩和し, バイアスの動的性質を無視するために, DCT(Debiasing contrastive learning)を提案する。
DCTは、ディストリビューション内のパフォーマンスを維持しながら、アウトオブディストリビューションデータセットの最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-12-11T06:16:14Z) - Simultaneous Improvement of ML Model Fairness and Performance by
Identifying Bias in Data [1.76179873429447]
トレーニング前にデータセットから削除すべき特定の種類のバイアスを記述したインスタンスを検出できるデータ前処理手法を提案する。
特に、類似した特徴を持つインスタンスが存在するが、保護属性の変動に起因するラベルが異なる問題設定では、固有のバイアスがデータセット内で引き起こされる、と主張する。
論文 参考訳(メタデータ) (2022-10-24T13:04:07Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - FairIF: Boosting Fairness in Deep Learning via Influence Functions with
Validation Set Sensitive Attributes [51.02407217197623]
本稿では,FAIRIFという2段階の学習アルゴリズムを提案する。
サンプル重みが計算される再重み付きデータセットの損失を最小限に抑える。
FAIRIFは、様々な種類のバイアスに対して、フェアネスとユーティリティのトレードオフを良くしたモデルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-15T05:14:48Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Managing dataset shift by adversarial validation for credit scoring [5.560471251954645]
トレーニングデータの分布と実際に予測する必要があるデータとの矛盾は、モデルパフォーマンスの低下を引き起こす可能性がある。
本稿では,クレジットスコアリングシナリオにおけるデータセットシフト問題を軽減するための,逆検証に基づく手法を提案する。
論文 参考訳(メタデータ) (2021-12-19T07:07:15Z) - Robust Fairness under Covariate Shift [11.151913007808927]
保護グループメンバーシップに関して公正な予測を行うことは、分類アルゴリズムの重要な要件となっている。
本稿では,ターゲット性能の面で最悪のケースに対して頑健な予測値を求める手法を提案する。
論文 参考訳(メタデータ) (2020-10-11T04:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。