論文の概要: Optimal Pre-Processing to Achieve Fairness and Its Relationship with
Total Variation Barycenter
- arxiv url: http://arxiv.org/abs/2101.06811v1
- Date: Mon, 18 Jan 2021 00:20:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 06:00:45.339670
- Title: Optimal Pre-Processing to Achieve Fairness and Its Relationship with
Total Variation Barycenter
- Title(参考訳): フェアネス達成のための最適前処理と全変動バリーセンタとの関係
- Authors: Farhad Farokhi
- Abstract要約: アウトプットを観察する確率は、人種や性別などの保護された属性に依存し、公正さを測定するために異なる影響を使用します。
その後、データの修復とも呼ばれる前処理を使用して公平性を強化します。
本研究では,データ前処理による予測モデルの成功度は,前処理前と処理後のデータの分布の総変動距離に上限があることを示した。
- 参考スコア(独自算出の注目度): 14.497406777219112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We use disparate impact, i.e., the extent that the probability of observing
an output depends on protected attributes such as race and gender, to measure
fairness. We prove that disparate impact is upper bounded by the total
variation distance between the distribution of the inputs given the protected
attributes. We then use pre-processing, also known as data repair, to enforce
fairness. We show that utility degradation, i.e., the extent that the success
of a forecasting model changes by pre-processing the data, is upper bounded by
the total variation distance between the distribution of the data before and
after pre-processing. Hence, the problem of finding the optimal pre-processing
regiment for enforcing fairness can be cast as minimizing total variations
distance between the distribution of the data before and after pre-processing
subject to a constraint on the total variation distance between the
distribution of the inputs given protected attributes. This problem is a linear
program that can be efficiently solved. We show that this problem is intimately
related to finding the barycenter (i.e., center of mass) of two distributions
when distances in the probability space are measured by total variation
distance. We also investigate the effect of differential privacy on fairness
using the proposed the total variation distances. We demonstrate the results
using numerical experimentation with a practice dataset.
- Abstract(参考訳): 我々は異なる影響、すなわち、アウトプットを観察する確率が人種や性別などの保護された属性に依存する程度を使って公正さを測定する。
保護属性が与えられた入力の分布の合計変動距離によって異なる影響が上界であることが証明された。
次に、公正性を強制するために前処理(データ修復とも呼ばれる)を使用します。
本研究では,データの事前処理による予測モデルの成功度が,前処理前後におけるデータ分布のばらつき距離によって上限されることを示す。
これにより、保護された属性の分布間の総変分距離の制約を受ける前処理前後のデータ分布間の総変分距離を最小化して、公正性を確保するための最適な前処理連隊を見つけることができる。
この問題は効率的に解くことができる線形プログラムである。
確率空間内の距離を全変動距離で測定した場合,この問題は2つの分布の重心(すなわち質量中心)の発見と密接に関連していることを示す。
また,差分プライバシーが公平性に及ぼす影響を,全変動距離を用いて検討した。
実践データセットを用いて数値実験を行い,実験結果を示す。
関連論文リスト
- Discriminative Estimation of Total Variation Distance: A Fidelity Auditor for Generative Data [10.678533056953784]
本稿では,2つの分布間の総変動(TV)距離を推定する判別手法を提案する。
本手法は,2つの分布の分類におけるベイズリスクとテレビの距離の関係を定量的に評価する。
分類において、特定の仮説クラスを選択することで、テレビの距離を推定する際の高速収束率が達成できることを実証する。
論文 参考訳(メタデータ) (2024-05-24T08:18:09Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Undersmoothing Causal Estimators with Generative Trees [0.0]
観察データから個別に治療効果を推定することで、標的となる介入の可能性を解き放つことができる。
しかし、観測データからこれらの効果を推測することは困難である。
本稿では,モデルの不特定に対処する新しい生成木に基づくアプローチについて検討する。
論文 参考訳(メタデータ) (2022-03-16T11:59:38Z) - Certifying Model Accuracy under Distribution Shifts [151.67113334248464]
本稿では,データ分布の有界ワッサースタインシフトの下でのモデルの精度について,証明可能なロバスト性保証を提案する。
変換空間におけるモデルの入力をランダム化する単純な手順は、変換の下での分布シフトに対して確実に堅牢であることを示す。
論文 参考訳(メタデータ) (2022-01-28T22:03:50Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Bias and Variance of Post-processing in Differential Privacy [53.29035917495491]
後処理免疫は、差分プライバシーの基本的な性質である。
ポストプロセッシングはバイアスをもたらし、ばらつきを増大させるとしばしば主張される。
本稿では,後処理の特性を理解するための第一歩を踏み出す。
論文 参考訳(メタデータ) (2020-10-09T02:12:54Z) - DEMI: Discriminative Estimator of Mutual Information [5.248805627195347]
連続確率変数間の相互情報を推定することは、高次元データにとってしばしば難解で困難である。
近年の進歩は、相互情報の変動的下界を最適化するためにニューラルネットワークを活用している。
提案手法は,データサンプルペアが結合分布から引き出される確率を提供する分類器の訓練に基づく。
論文 参考訳(メタデータ) (2020-10-05T04:19:27Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。