論文の概要: Auditing Fairness by Betting
- arxiv url: http://arxiv.org/abs/2305.17570v1
- Date: Sat, 27 May 2023 20:14:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 18:05:08.577619
- Title: Auditing Fairness by Betting
- Title(参考訳): 賭けによる公正の監査
- Authors: Ben Chugg, Santiago Cortes-Gomez, Bryan Wilder, Aaditya Ramdas
- Abstract要約: 我々は,デプロイされた分類モデルと回帰モデルの公平性を評価するための,実用的で効率的で非パラメトリックな手法を提供する。
我々の手法は逐次的であり、入ってくるデータの継続的なモニタリングを可能にする。
いくつかのベンチマークフェアネスデータセットにおいて,本手法の有効性を示す。
- 参考スコア(独自算出の注目度): 53.648372694722795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We provide practical, efficient, and nonparametric methods for auditing the
fairness of deployed classification and regression models. Whereas previous
work relies on a fixed-sample size, our methods are sequential and allow for
the continuous monitoring of incoming data, making them highly amenable to
tracking the fairness of real-world systems. We also allow the data to be
collected by a probabilistic policy as opposed to sampled uniformly from the
population. This enables auditing to be conducted on data gathered for another
purpose. Moreover, this policy may change over time and different policies may
be used on different subpopulations. Finally, our methods can handle
distribution shift resulting from either changes to the model or changes in the
underlying population. Our approach is based on recent progress in
anytime-valid inference and game-theoretic statistics-the "testing by betting"
framework in particular. These connections ensure that our methods are
interpretable, fast, and easy to implement. We demonstrate the efficacy of our
methods on several benchmark fairness datasets.
- Abstract(参考訳): 我々は,デプロイされた分類と回帰モデルの公平性を監査するための実用的,効率的,非パラメトリックな手法を提供する。
従来の作業では固定サンプルサイズに依存していましたが、私たちの手法はシーケンシャルで、入ってくるデータの継続的な監視を可能にします。
我々はまた、人口から一様にサンプリングされるのに対して、確率的政策によってデータを収集することを許可する。
これにより、別の目的のために収集されたデータで監査を行うことができる。
さらに、この政策は時間とともに変化し、異なる政策は異なるサブ人口に使用される。
最後に,本手法は,モデルの変化や基盤人口の変化から生じる分布変化を処理できる。
我々のアプローチは、特に「賭けによるテスト」フレームワークであるanytime-valid推論とゲーム理論統計の最近の進歩に基づいている。
これらの接続により、私たちのメソッドは解釈可能で、高速で、実装が容易になります。
いくつかのベンチマークフェアネスデータセットにおいて,本手法の有効性を示す。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Sample and Predict Your Latent: Modality-free Sequential Disentanglement
via Contrastive Estimation [2.7759072740347017]
外部信号のないコントラスト推定に基づく自己教師付きシーケンシャル・アンタングルメント・フレームワークを提案する。
実際に,データのセマンティックに類似し,異種なビューに対して,統一的で効率的かつ容易にサンプリングできる手法を提案する。
提案手法は,既存の手法と比較して最先端の結果を示す。
論文 参考訳(メタデータ) (2023-05-25T10:50:30Z) - Statistical Inference for Fairness Auditing [4.318555434063274]
我々は、このタスクを複数の仮説テストの観点から「フェアネス監査」とみなしている。
ブートストラップを用いて,グループ間のパフォーマンス格差を同時にバインドする方法を示す。
本手法は,モデルアンダーパフォーマンスの影響を受けるサブポピュレーションのフラグ付けや,モデルが適切に機能するサブポピュレーションの認証に利用できる。
論文 参考訳(メタデータ) (2023-05-05T17:54:22Z) - Towards Better Understanding Attribution Methods [77.1487219861185]
モデル決定に最も影響を及ぼす画像領域を特定するために、ポストホック属性法が提案されている。
本稿では,これらの手法の忠実度をより確実に評価するための3つの新しい評価手法を提案する。
また,いくつかの属性法の性能を著しく向上する処理後平滑化ステップを提案する。
論文 参考訳(メタデータ) (2022-05-20T20:50:17Z) - Adaptive Conformal Inference Under Distribution Shift [0.0]
本研究では,未知の方法でデータ生成分布を時間とともに変化させるオンライン環境において,予測セットを形成する手法を開発した。
我々のフレームワークは、任意のブラックボックスメソッドと組み合わせられる一般的なラッパーを提供するために、共形推論のアイデアに基づいている。
我々は,2つの実世界のデータセット上で適応型共形推論法を検証し,その予測が可視的および有意な分布シフトに対して堅牢であることを見出した。
論文 参考訳(メタデータ) (2021-06-01T01:37:32Z) - Off-Policy Evaluation of Bandit Algorithm from Dependent Samples under
Batch Update Policy [8.807587076209566]
オフ・ポリティクス評価(OPE)の目的は、行動政策を通じて得られた履歴データを用いて、新しい政策を評価することである。
文脈的帯域幅は過去の観測に基づいてポリシーを更新するため、サンプルは独立ではなく、同一に分布する。
本稿では,従属サンプルに対するマーチンゲール差分列(MDS)から推定器を構築することにより,この問題に対処する。
論文 参考訳(メタデータ) (2020-10-23T15:22:57Z) - BREEDS: Benchmarks for Subpopulation Shift [98.90314444545204]
本研究では,人口変動に対するモデルのロバスト性を評価する手法を開発した。
既存のデータセットの基盤となるクラス構造を利用して、トレーニングとテストの分散を構成するデータサブポピュレーションを制御する。
この手法をImageNetデータセットに適用し、様々な粒度のサブポピュレーションシフトベンチマークスイートを作成する。
論文 参考訳(メタデータ) (2020-08-11T17:04:47Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。