論文の概要: Fair Classification with Partial Feedback: An Exploration-Based
Data-Collection Approach
- arxiv url: http://arxiv.org/abs/2402.11338v1
- Date: Sat, 17 Feb 2024 17:09:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 21:44:59.907563
- Title: Fair Classification with Partial Feedback: An Exploration-Based
Data-Collection Approach
- Title(参考訳): 部分フィードバックによる公平な分類:探索に基づくデータ収集アプローチ
- Authors: Vijay Keswani, Anay Mehrotra, L. Elisa Celis
- Abstract要約: 多くの予測的文脈において、真の結果は過去に肯定的に分類されたサンプルに対してのみ観察される。
我々は、利用可能なデータを用いて分類器を訓練し、探索戦略のファミリーを持つアプローチを提案する。
提案手法は,収集した結果データの品質を継続的に向上し,すべてのグループに対して真の正の比率を向上することを示す。
- 参考スコア(独自算出の注目度): 16.868192461002558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many predictive contexts (e.g., credit lending), true outcomes are only
observed for samples that were positively classified in the past. These past
observations, in turn, form training datasets for classifiers that make future
predictions. However, such training datasets lack information about the
outcomes of samples that were (incorrectly) negatively classified in the past
and can lead to erroneous classifiers. We present an approach that trains a
classifier using available data and comes with a family of exploration
strategies to collect outcome data about subpopulations that otherwise would
have been ignored. For any exploration strategy, the approach comes with
guarantees that (1) all sub-populations are explored, (2) the fraction of false
positives is bounded, and (3) the trained classifier converges to a "desired"
classifier. The right exploration strategy is context-dependent; it can be
chosen to improve learning guarantees and encode context-specific group
fairness properties. Evaluation on real-world datasets shows that this approach
consistently boosts the quality of collected outcome data and improves the
fraction of true positives for all groups, with only a small reduction in
predictive utility.
- Abstract(参考訳): 多くの予測的文脈(例えば信用融資)において、真の結果は過去に肯定的に分類されたサンプルに対してのみ観察される。
これらの過去の観測は、将来の予測を行う分類器のトレーニングデータセットを形成する。
しかし、このようなトレーニングデータセットは、過去に(誤って)否定的に分類され、誤った分類につながるサンプルの結果に関する情報を欠いている。
本稿では、利用可能なデータを用いて分類器を訓練し、それ以外は無視されるであろうサブ集団に関する結果データを集めるための探索戦略のファミリーを伴うアプローチを提案する。
いかなる探索戦略に対しても、アプローチは(1)全てのサブポピュレーションが探索され、(2)偽陽性の断片が有界であること、(3)訓練された分類器が「望まれる」分類器に収束することを保証する。
適切な探索戦略は文脈依存であり、学習保証を改善し、文脈固有のグループフェアネス特性をエンコードするために選択することができる。
実世界のデータセットの評価は、このアプローチが一貫して収集された結果データの品質を高め、予測ユーティリティをわずかに減らすだけで、すべてのグループに対する真の正の比率を改善することを示している。
関連論文リスト
- PUAL: A Classifier on Trifurcate Positive-Unlabeled Data [29.617810881312867]
非対称損失(PUAL)を有するPU分類器を提案する。
我々は、PUALが非線形決定境界を得ることを可能にするカーネルベースのアルゴリズムを開発した。
シミュレーションと実世界の両方のデータセットの実験を通して、PUALはトリフルケートデータの良好な分類を実現できることを示す。
論文 参考訳(メタデータ) (2024-05-31T16:18:06Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Memory Consistency Guided Divide-and-Conquer Learning for Generalized
Category Discovery [56.172872410834664]
一般カテゴリー発見(GCD)は、半教師付き学習のより現実的で挑戦的な設定に対処することを目的としている。
メモリ一貫性を誘導する分枝・分枝学習フレームワーク(MCDL)を提案する。
本手法は,画像認識の目に見えるクラスと見えないクラスの両方において,最先端のモデルよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-24T09:39:45Z) - Leveraging Structure for Improved Classification of Grouped Biased Data [8.121462458089143]
データポイントが自然にグループ化されるアプリケーションに対する半教師付きバイナリ分類を検討する。
我々は、この構造を明示的に活用し、最適、グループ対応、確率出力の分類器を学習する半教師付きアルゴリズムを導出する。
論文 参考訳(メタデータ) (2022-12-07T15:18:21Z) - On Learning Fairness and Accuracy on Multiple Subgroups [9.789933013990966]
両レベル対象として定式化することで,すべての部分群に対して公正な予測器を学習する原理的手法を提案する。
具体的には、サブグループ固有の予測器は、少量のデータと公正な予測器を通して下位層で学習される。
上位レベルでは、フェア予測器は全てのサブグループ固有の予測器に近接するように更新される。
論文 参考訳(メタデータ) (2022-10-19T18:59:56Z) - Classification of datasets with imputed missing values: does imputation
quality matter? [2.7646249774183]
不完全なデータセットでサンプルを分類するのは簡単ではない。
品質を評価するのによく使われる尺度がいかに欠陥があるかを実証する。
本稿では,データ全体の分布をいかに再現するかに焦点をあてた,新たな相違点のクラスを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:58:03Z) - Towards Group Robustness in the presence of Partial Group Labels [61.33713547766866]
入力サンプルとターゲットラベルの間に 急激な相関関係がある ニューラルネットワークの予測を誤った方向に導く
本稿では,制約セットから最悪のグループ割り当てを最適化するアルゴリズムを提案する。
グループ間で総合的な集計精度を維持しつつ,少数集団のパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2022-01-10T22:04:48Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Doubly Contrastive Deep Clustering [135.7001508427597]
本稿では、サンプルビューとクラスビューの両方でコントラスト損失を構築する新しい二重コントラストディープクラスタリング(DCDC)フレームワークを紹介します。
具体的には、サンプルビューに対して、元のサンプルとその拡張バージョンのクラス分布を正のサンプルペアとして設定する。
クラスビューでは、クラスのサンプル分布から正のペアと負のペアを構築します。
このように、2つのコントラスト損失は、サンプルとクラスレベルでのミニバッチサンプルのクラスタリング結果をうまく制限します。
論文 参考訳(メタデータ) (2021-03-09T15:15:32Z) - Learning from Positive and Unlabeled Data with Arbitrary Positive Shift [11.663072799764542]
本稿では,未ラベルデータに対して任意の非表現陽性データであってもPU学習が可能であることを示す。
これを統計的に一貫した2つの手法に統合し、任意の正のバイアスに対処する。
実験により,多数の実世界のデータセットにまたがる手法の有効性が示された。
論文 参考訳(メタデータ) (2020-02-24T13:53:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。