論文の概要: Fair Classification with Partial Feedback: An Exploration-Based Data Collection Approach
- arxiv url: http://arxiv.org/abs/2402.11338v2
- Date: Sat, 1 Jun 2024 12:48:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-04 18:33:51.117683
- Title: Fair Classification with Partial Feedback: An Exploration-Based Data Collection Approach
- Title(参考訳): 部分フィードバックによる公平な分類:探索に基づくデータ収集アプローチ
- Authors: Vijay Keswani, Anay Mehrotra, L. Elisa Celis,
- Abstract要約: 多くの予測的文脈において、真の結果は過去に肯定的に分類されたサンプルに対してのみ観察される。
我々は、利用可能なデータを用いて分類器を訓練し、探索戦略のファミリーを持つアプローチを提案する。
提案手法は,収集した結果データの品質を継続的に向上し,すべてのグループに対して真の正の比率を向上することを示す。
- 参考スコア(独自算出の注目度): 15.008626822593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many predictive contexts (e.g., credit lending), true outcomes are only observed for samples that were positively classified in the past. These past observations, in turn, form training datasets for classifiers that make future predictions. However, such training datasets lack information about the outcomes of samples that were (incorrectly) negatively classified in the past and can lead to erroneous classifiers. We present an approach that trains a classifier using available data and comes with a family of exploration strategies to collect outcome data about subpopulations that otherwise would have been ignored. For any exploration strategy, the approach comes with guarantees that (1) all sub-populations are explored, (2) the fraction of false positives is bounded, and (3) the trained classifier converges to a ``desired'' classifier. The right exploration strategy is context-dependent; it can be chosen to improve learning guarantees and encode context-specific group fairness properties. Evaluation on real-world datasets shows that this approach consistently boosts the quality of collected outcome data and improves the fraction of true positives for all groups, with only a small reduction in predictive utility.
- Abstract(参考訳): 多くの予測的文脈(例えば信用貸与)において、真の結果は過去に肯定的に分類されたサンプルに対してのみ観察される。
これらの過去の観測は、将来の予測を行う分類器のための訓練データセットを形成する。
しかし、そのようなトレーニングデータセットには、過去に否定的に分類されたサンプルの結果に関する情報が欠けており、誤分類に繋がる可能性がある。
本稿では、利用可能なデータを用いて分類器を訓練し、それ以外は無視されるであろうサブ集団に関する結果データを集めるための探索戦略のファミリーを伴うアプローチを提案する。
いかなる探索戦略に対しても、アプローチは(1)全てのサブポピュレーションが探索され、(2)偽陽性の分数だけが有界であること、(3)訓練された分類器が `desired'' の分類器に収束することを保証する。
適切な探索戦略は文脈依存であり、学習保証を改善し、文脈固有のグループフェアネス特性を符号化するために選択することができる。
実世界のデータセットの評価は、このアプローチが収集された結果データの品質を一貫して向上し、予測ユーティリティをわずかに削減するだけで、すべてのグループの真の正の比率を向上することを示している。
関連論文リスト
- PUAL: A Classifier on Trifurcate Positive-Unlabeled Data [29.617810881312867]
非対称損失(PUAL)を有するPU分類器を提案する。
我々は、PUALが非線形決定境界を得ることを可能にするカーネルベースのアルゴリズムを開発した。
シミュレーションと実世界の両方のデータセットの実験を通して、PUALはトリフルケートデータの良好な分類を実現できることを示す。
論文 参考訳(メタデータ) (2024-05-31T16:18:06Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Memory Consistency Guided Divide-and-Conquer Learning for Generalized
Category Discovery [56.172872410834664]
一般カテゴリー発見(GCD)は、半教師付き学習のより現実的で挑戦的な設定に対処することを目的としている。
メモリ一貫性を誘導する分枝・分枝学習フレームワーク(MCDL)を提案する。
本手法は,画像認識の目に見えるクラスと見えないクラスの両方において,最先端のモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-24T09:39:45Z) - Leveraging Structure for Improved Classification of Grouped Biased Data [8.121462458089143]
データポイントが自然にグループ化されるアプリケーションに対する半教師付きバイナリ分類を検討する。
我々は、この構造を明示的に活用し、最適、グループ対応、確率出力の分類器を学習する半教師付きアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-12-07T15:18:21Z) - On Learning Fairness and Accuracy on Multiple Subgroups [9.789933013990966]
両レベル対象として定式化することで,すべての部分群に対して公正な予測器を学習する原理的手法を提案する。
具体的には、サブグループ固有の予測器は、少量のデータと公正な予測器を通して下位層で学習される。
上位レベルでは、フェア予測器は全てのサブグループ固有の予測器に近接するように更新される。
論文 参考訳(メタデータ) (2022-10-19T18:59:56Z) - Classification of datasets with imputed missing values: does imputation
quality matter? [2.7646249774183]
不完全なデータセットでサンプルを分類するのは簡単ではない。
品質を評価するのによく使われる尺度がいかに欠陥があるかを実証する。
本稿では,データ全体の分布をいかに再現するかに焦点をあてた,新たな相違点のクラスを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:58:03Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Doubly Contrastive Deep Clustering [135.7001508427597]
本稿では、サンプルビューとクラスビューの両方でコントラスト損失を構築する新しい二重コントラストディープクラスタリング(DCDC)フレームワークを紹介します。
具体的には、サンプルビューに対して、元のサンプルとその拡張バージョンのクラス分布を正のサンプルペアとして設定する。
クラスビューでは、クラスのサンプル分布から正のペアと負のペアを構築します。
このように、2つのコントラスト損失は、サンプルとクラスレベルでのミニバッチサンプルのクラスタリング結果をうまく制限します。
論文 参考訳(メタデータ) (2021-03-09T15:15:32Z) - Learning from Positive and Unlabeled Data with Arbitrary Positive Shift [11.663072799764542]
本稿では,未ラベルデータに対して任意の非表現陽性データであってもPU学習が可能であることを示す。
これを統計的に一貫した2つの手法に統合し、任意の正のバイアスに対処する。
実験により,多数の実世界のデータセットにまたがる手法の有効性が示された。
論文 参考訳(メタデータ) (2020-02-24T13:53:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。