Fugu-MT 論文翻訳(概要): The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective

論文の概要: The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective

arxiv url: http://arxiv.org/abs/2012.11448v1
Date: Mon, 21 Dec 2020 16:10:00 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-27 12:12:32.907819
Title: The Importance of Modeling Data Missingness in Algorithmic Fairness: A Causal Perspective
Title（参考訳）: アルゴリズムフェアネスにおけるデータ不足のモデル化の重要性:因果的視点
Authors: Naman Goel, Alfonso Amayuelas, Amit Deshpande, Amit Sharma
Abstract要約: 機械学習のためのトレーニングデータセットには、ある種の欠落があることが多い。この欠如は、無視されると、モデルのデプロイ時にトレーニング手順のフェアネス保証を無効にする。一般的な公平性アルゴリズムで使用される様々な分布が、トレーニングデータから回復できない、または回復できない条件を示します。
参考スコア（独自算出の注目度）: 14.622708494548363
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Training datasets for machine learning often have some form of missingness. For example, to learn a model for deciding whom to give a loan, the available training data includes individuals who were given a loan in the past, but not those who were not. This missingness, if ignored, nullifies any fairness guarantee of the training procedure when the model is deployed. Using causal graphs, we characterize the missingness mechanisms in different real-world scenarios. We show conditions under which various distributions, used in popular fairness algorithms, can or can not be recovered from the training data. Our theoretical results imply that many of these algorithms can not guarantee fairness in practice. Modeling missingness also helps to identify correct design principles for fair algorithms. For example, in multi-stage settings where decisions are made in multiple screening rounds, we use our framework to derive the minimal distributions required to design a fair algorithm. Our proposed algorithm decentralizes the decision-making process and still achieves similar performance to the optimal algorithm that requires centralization and non-recoverable distributions.
Abstract（参考訳）: 機械学習のためのトレーニングデータセットには、何らかの欠如があることが多い。例えば、誰にローンを与えるかを決めるモデルを学ぶために、利用可能なトレーニングデータは、過去にローンを与えられた個人を含むが、そうではない個人を含む。この欠如は、無視されると、モデルのデプロイ時にトレーニング手順のフェアネス保証を無効にする。因果グラフを用いて,実世界の異なるシナリオにおける欠落機構を特徴付ける。一般的な公平性アルゴリズムで使用される様々な分布が、トレーニングデータから復元可能であるか、できないかを示す。我々の理論的結果は、これらのアルゴリズムの多くは実際フェアネスを保証できないことを示している。不足をモデル化することは、公正アルゴリズムの設計原則の正しい特定にも役立ちます。例えば、複数のスクリーニングラウンドで意思決定を行うマルチステージ環境では、公正なアルゴリズムの設計に必要な最小限の分布を導出するためにフレームワークを使用します。提案手法は意思決定過程を分散化し, 集中化と再定義不能分布を必要とする最適アルゴリズムと同様の性能を実現する。

関連論文リスト

Targeted Learning for Data Fairness [52.59573714151884]
データ生成プロセス自体の公平性を評価することにより、公平性推論を拡張する。我々は、人口統計学的平等、平等機会、条件付き相互情報から推定する。提案手法を検証するため,いくつかのシミュレーションを行い,実データに適用する。
論文参考訳（メタデータ） (2025-02-06T18:51:28Z)
Towards Harmless Rawlsian Fairness Regardless of Demographic Prior [57.30787578956235]
トレーニングセットに事前の人口統計が提供されない場合に,有効性を損なうことなく公平性を達成する可能性を探る。本稿では,経験的損失の最適セット内でのトレーニング損失の分散を最小限に抑えるため,VFairという簡単な手法を提案する。
論文参考訳（メタデータ） (2024-11-04T12:40:34Z)
SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning [49.94607673097326]
ラベルなしデータの分散に関する前提を前提としない、高度に適応可能なフレームワークをSimProとして提案する。我々のフレームワークは確率モデルに基づいており、期待最大化アルゴリズムを革新的に洗練する。本手法は,様々なベンチマークやデータ分散シナリオにまたがる一貫した最先端性能を示す。
論文参考訳（メタデータ） (2024-02-21T03:39:04Z)
Fairness Uncertainty Quantification: How certain are you that the model is fair? [13.209748908186606]
現代の機械学習において、グラディエント・Descent(SGD)型アルゴリズムは、学習されたモデルがランダムであることを示す訓練アルゴリズムとして、ほぼ常に使用される。本研究では,グループフェアネスを意識した信頼区間(CI)、特にDI(Disparate Impact)とDM(Disparate Mistreatment)を意識した線形二項分類器をオンラインSGD型アルゴリズムを用いてトレーニングする場合に,不公平性テストのための信頼区間(CI)を提供する。
論文参考訳（メタデータ） (2023-04-27T04:07:58Z)
On the Necessity of Auditable Algorithmic Definitions for Machine Unlearning [13.149070833843133]
機械学習、すなわち、トレーニングデータのいくつかを忘れるモデルを持つことは、プライバシー法が忘れられる権利の変種を促進するにつれ、ますます重要になっている。まず、ほぼ未学習のモデルが正確に訓練されたモデルに近いことを証明しようとする、近似的未学習の定義は、異なるデータセットを用いて同じモデルを得ることができるため、正しくないことを示す。そして、正確なアンラーニングアプローチに目を向け、アンラーニングのクレームの検証方法を尋ねます。
論文参考訳（メタデータ） (2021-10-22T16:16:56Z)
Distributionally Robust Semi-Supervised Learning Over Graphs [68.29280230284712]
グラフ構造化データに対する半教師付き学習(SSL)は、多くのネットワークサイエンスアプリケーションに現れる。グラフ上の学習を効率的に管理するために,近年,グラフニューラルネットワーク(GNN)の変種が開発されている。実際に成功したにも拘わらず、既存の手法のほとんどは、不確実な結節属性を持つグラフを扱うことができない。ノイズ測定によって得られたデータに関連する分布の不確実性によっても問題が発生する。分散ロバストな学習フレームワークを開発し,摂動に対する定量的ロバスト性を示すモデルを訓練する。
論文参考訳（メタデータ） (2021-10-20T14:23:54Z)
Fairness without Imputation: A Decision Tree Approach for Fair Prediction with Missing Values [4.973456986972679]
欠落した値を持つデータを用いて機械学習モデルを訓練する際の公平性の懸念について検討する。本稿では,個別の計算処理や学習プロセスを必要としない決定木に基づく統合的アプローチを提案する。提案手法は,有意なデータセットに適用した既存のフェアネス介入手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-09-21T20:46:22Z)
Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文参考訳（メタデータ） (2021-04-14T14:20:22Z)
Metrics and methods for a systematic comparison of fairness-aware machine learning algorithms [0.0]
この研究はこの種の最も包括的なものである。フェアネス、予測性能、キャリブレーション品質、28種類のモデリングパイプラインの速度を考慮に入れている。また,フェアネスを意識したアルゴリズムは,予測力の低下を伴わずにフェアネスを誘導できることがわかった。
論文参考訳（メタデータ） (2020-10-08T13:58:09Z)
Fairness in Semi-supervised Learning: Unlabeled Data Help to Reduce Discrimination [53.3082498402884]
機械学習の台頭における投機は、機械学習モデルによる決定が公正かどうかである。本稿では,未ラベルデータのラベルを予測するための擬似ラベリングを含む,前処理フェーズにおける公平な半教師付き学習の枠組みを提案する。偏見、分散、ノイズの理論的分解分析は、半教師付き学習における差別の異なる源とそれらが公平性に与える影響を浮き彫りにする。
論文参考訳（メタデータ） (2020-09-25T05:48:56Z)
Learning while Respecting Privacy and Robustness to Distributional Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文参考訳（メタデータ） (2020-07-07T18:25:25Z)
Do the Machine Learning Models on a Crowd Sourced Platform Exhibit Bias? An Empirical Study on Model Fairness [7.673007415383724]
5つの異なるタスクに使用したKaggleから、40の上位モデルのベンチマークを作成しました。これらのモデルに7つの緩和手法を適用し、公正性、緩和結果、および性能への影響を分析した。
論文参考訳（メタデータ） (2020-05-21T23:35:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。