論文の概要: Explainability for identification of vulnerable groups in machine
learning models
- arxiv url: http://arxiv.org/abs/2203.00317v1
- Date: Tue, 1 Mar 2022 09:44:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 15:42:57.529446
- Title: Explainability for identification of vulnerable groups in machine
learning models
- Title(参考訳): 機械学習モデルにおける脆弱性群同定のための説明可能性
- Authors: Inga Str\"umke, and Marija Slavkovik
- Abstract要約: フィールドとしての機械学習の公正性は、情報処理の下で個人やグループの公正な扱いに焦点が当てられている。
これにより、マシンラーニングの下で脆弱な個人やグループを保護する方法とタイミングに関する新たな課題が提起される。
既存の公正性も既存の説明可能性も、予測モデルが脆弱性を特定しているかどうかを確認できない。
- 参考スコア(独自算出の注目度): 1.7403133838762446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: If a prediction model identifies vulnerable individuals or groups, the use of
that model may become an ethical issue. But can we know that this is what a
model does? Machine learning fairness as a field is focused on the just
treatment of individuals and groups under information processing with machine
learning methods. While considerable attention has been given to mitigating
discrimination of protected groups, vulnerable groups have not received the
same attention. Unlike protected groups, which can be regarded as always
vulnerable, a vulnerable group may be vulnerable in one context but not in
another. This raises new challenges on how and when to protect vulnerable
individuals and groups under machine learning. Methods from explainable
artificial intelligence (XAI), in contrast, do consider more contextual issues
and are concerned with answering the question "why was this decision made?".
Neither existing fairness nor existing explainability methods allow us to
ascertain if a prediction model identifies vulnerability. We discuss this
problem and propose approaches for analysing prediction models in this respect.
- Abstract(参考訳): 予測モデルが脆弱な個人やグループを特定する場合、そのモデルの使用は倫理的な問題になる可能性がある。
しかし、これはモデルがやっていることですか?
フィールドとしての機械学習の公正性は、情報処理と機械学習の手法による個人とグループの公正な扱いに焦点を当てている。
保護された集団の差別緩和にかなりの注意が払われているが、脆弱な集団は同じ注意を払われていない。
常に脆弱であると見なされる保護されたグループとは異なり、脆弱なグループは、ある文脈では弱いが別の状況では弱い。
これは、機械学習下で脆弱な個人やグループを保護する方法と時間に関する新たな課題を提起する。
説明可能な人工知能(XAI)の手法は、より文脈的な問題を考慮し、「なぜこの決定が下されたのか」という問いに答えることに関心がある。
既存の公平性や既存の説明可能性メソッドでは、予測モデルが脆弱性を特定するかどうかを確認できません。
そこで本研究では,この問題について議論し,予測モデルの解析手法を提案する。
関連論文リスト
- Hacking a surrogate model approach to XAI [49.1574468325115]
識別されたサブグループがブラックボックスADMシステムから肯定的な決定を下さない場合でも、対応するグループメンバーシップの問題は、必要に応じて低いレベルまで押し下げることができることを示す。
我々のアプローチは、他の代理モデルに容易に一般化できる。
論文 参考訳(メタデータ) (2024-06-24T13:18:02Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - Against Algorithmic Exploitation of Human Vulnerabilities [2.6918074738262194]
我々は、機械学習モデルが故意に脆弱性をモデル化することを懸念している。
一般的な脆弱性を記述し、アルゴリズムによる意思決定においてそれらが役割を担っている可能性を示す。
本稿では,脆弱性モデリングの可能性を検出する手法の一連の要件を提案する。
論文 参考訳(メタデータ) (2023-01-12T13:15:24Z) - Revealing Unfair Models by Mining Interpretable Evidence [50.48264727620845]
機械学習の人気は、不公平なモデルがハイリスクなアプリケーションにデプロイされるリスクを高めている。
本稿では,解釈可能な証拠をマイニングすることで不公平なモデルを明らかにする新しい課題に取り組む。
本手法は,訓練されたモデルの不公平性を効果的に明らかにするために,極めて解釈可能な確固たる証拠を見出す。
論文 参考訳(メタデータ) (2022-07-12T20:03:08Z) - "You Can't Fix What You Can't Measure": Privately Measuring Demographic
Performance Disparities in Federated Learning [78.70083858195906]
グループメンバーシップのプライバシを保護しつつ,グループ間でのパフォーマンスの差異を測定するための,差分プライベートなメカニズムを提案する。
我々の結果は、以前の研究の示唆に反して、プライバシ保護は必ずしもフェデレーションモデルの性能格差の特定と矛盾しているわけではないことを示している。
論文 参考訳(メタデータ) (2022-06-24T09:46:43Z) - SF-PATE: Scalable, Fair, and Private Aggregation of Teacher Ensembles [50.90773979394264]
本稿では、個人の機密情報のプライバシーを保護しつつ、差別的でない予測者の学習を可能にするモデルについて検討する。
提案モデルの主な特徴は、プライバシ保護とフェアモデルを作成するために、オフ・ザ・セルフと非プライベートフェアモデルの採用を可能にすることである。
論文 参考訳(メタデータ) (2022-04-11T14:42:54Z) - Cross-model Fairness: Empirical Study of Fairness and Ethics Under Model Multiplicity [10.144058870887061]
1つの予測器が等しく機能するモデルのグループからアドホックに選択された場合、個人は害を受ける可能性があると我々は主張する。
これらの不公平性は実生活で容易に発見でき、技術的手段だけで緩和することは困難である可能性が示唆された。
論文 参考訳(メタデータ) (2022-03-14T14:33:39Z) - Measuring Fairness Under Unawareness of Sensitive Attributes: A
Quantification-Based Approach [131.20444904674494]
センシティブな属性の無意識下でのグループフェアネスを測定する問題に取り組む。
定量化手法は, フェアネスと無意識の問題に対処するのに特に適していることを示す。
論文 参考訳(メタデータ) (2021-09-17T13:45:46Z) - When and How to Fool Explainable Models (and Humans) with Adversarial
Examples [1.439518478021091]
説明可能な機械学習モデルに対する敵攻撃の可能性と限界について検討する。
まず、逆例の概念を拡張して、説明可能な機械学習シナリオに適合する。
次に、説明可能なモデルに対して、逆例を生成できるかどうかを総合的に検討する枠組みを提案する。
論文 参考訳(メタデータ) (2021-07-05T11:20:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。