論文の概要: Causal Feature Selection for Algorithmic Fairness
- arxiv url: http://arxiv.org/abs/2006.06053v2
- Date: Thu, 31 Mar 2022 08:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:15:20.338535
- Title: Causal Feature Selection for Algorithmic Fairness
- Title(参考訳): アルゴリズムフェアネスのための因果的特徴選択
- Authors: Sainyam Galhotra, Karthikeyan Shanmugam, Prasanna Sattigeri and Kush
R. Varshney
- Abstract要約: データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
- 参考スコア(独自算出の注目度): 61.767399505764736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of machine learning (ML) in high-stakes societal decisions has
encouraged the consideration of fairness throughout the ML lifecycle. Although
data integration is one of the primary steps to generate high quality training
data, most of the fairness literature ignores this stage. In this work, we
consider fairness in the integration component of data management, aiming to
identify features that improve prediction without adding any bias to the
dataset. We work under the causal interventional fairness paradigm. Without
requiring the underlying structural causal model a priori, we propose an
approach to identify a sub-collection of features that ensure the fairness of
the dataset by performing conditional independence tests between different
subsets of features. We use group testing to improve the complexity of the
approach. We theoretically prove the correctness of the proposed algorithm to
identify features that ensure interventional fairness and show that sub-linear
conditional independence tests are sufficient to identify these variables. A
detailed empirical evaluation is performed on real-world datasets to
demonstrate the efficacy and efficiency of our technique.
- Abstract(参考訳): 機械学習(ML)を高度な社会的決定に利用することで、MLライフサイクル全体を通して公平性の検討が促進されている。
データ統合は高品質なトレーニングデータを生成するための主要なステップの1つだが、公正な文献のほとんどはこの段階を無視している。
本研究では、データセットにバイアスを加えることなく予測を改善する機能を特定することを目的として、データ管理の統合コンポーネントの公平性を考察する。
我々は因果干渉公正パラダイムの下で働いている。
基礎となる構造因果モデルを事前に必要とせず,特徴の異なるサブセット間で条件付き独立テストを行うことにより,データセットの公平性を保証する特徴のサブコレクションを同定するアプローチを提案する。
このアプローチの複雑さを改善するために、グループテストを使用します。
提案アルゴリズムの正しさを理論的に証明し、介入公正性を保証する特徴を同定し、これらの変数を特定するのに十分であることを示す。
本手法の有効性と効率を示すため,実世界のデータセット上で詳細な経験的評価を行った。
関連論文リスト
- Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Balancing Fairness and Accuracy in Data-Restricted Binary Classification [14.439413517433891]
本稿では,4つの実践シナリオ下での精度と公平性のトレードオフをモデル化する枠組みを提案する。
3つのデータセットの実験では、トレードオフを定量化するためのツールとして提案されたフレームワークの有用性が示されている。
論文 参考訳(メタデータ) (2024-03-12T15:01:27Z) - Fairness Without Harm: An Influence-Guided Active Sampling Approach [32.173195437797766]
我々は、モデルの精度に害を与えることなく、グループフェアネスの格差を軽減するモデルを訓練することを目指している。
公正なアクティブな学習アプローチのような現在のデータ取得方法は、通常、アノテートセンシティブな属性を必要とする。
トレーニンググループアノテーションに依存しない抽出可能なアクティブデータサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-20T07:57:38Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z) - Fair and Optimal Classification via Post-Processing [10.163721748735801]
本稿では、分類問題における人口統計学の特質的トレードオフの完全な評価について述べる。
ランダム化および属性認識フェア分類器によって達成可能な最小誤差率は、ワッサーシュタイン・バリセンタ問題の最適値によって与えられることを示す。
論文 参考訳(メタデータ) (2022-11-03T00:04:04Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Information Theoretic Measures for Fairness-aware Feature Selection [27.06618125828978]
我々は,特徴の精度と識別的影響に関する情報理論に基づく,公平性を考慮した特徴選択のためのフレームワークを開発する。
具体的には、この機能が正確性や非差別的判断にどのように影響するかを定量化する、各機能に対する公平性ユーティリティスコアを設計することを目的としています。
論文 参考訳(メタデータ) (2021-06-01T20:11:54Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Decomposed Adversarial Learned Inference [118.27187231452852]
我々は,DALI(Decomposed Adversarial Learned Inference)という新しいアプローチを提案する。
DALIは、データ空間とコード空間の両方の事前および条件分布を明示的に一致させる。
MNIST, CIFAR-10, CelebAデータセットにおけるDALIの有効性を検証する。
論文 参考訳(メタデータ) (2020-04-21T20:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。