論文の概要: What will it take to generate fairness-preserving explanations?
- arxiv url: http://arxiv.org/abs/2106.13346v1
- Date: Thu, 24 Jun 2021 23:03:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 01:21:29.214529
- Title: What will it take to generate fairness-preserving explanations?
- Title(参考訳): 公平さを保った説明を生成するのには何が必要か?
- Authors: Jessica Dai, Sohini Upadhyay, Stephen H. Bach, Himabindu Lakkaraju
- Abstract要約: 我々は、データセットに適用された説明に焦点をあて、ブラックボックスアルゴリズムの公平性を必ずしも保持していないことを示唆する。
フェアネスの観点から情報的かつ関連性の高い説明を評価・生成するための今後の研究方向を提案する。
- 参考スコア(独自算出の注目度): 15.801388187383973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In situations where explanations of black-box models may be useful, the
fairness of the black-box is also often a relevant concern. However, the link
between the fairness of the black-box model and the behavior of explanations
for the black-box is unclear. We focus on explanations applied to tabular
datasets, suggesting that explanations do not necessarily preserve the fairness
properties of the black-box algorithm. In other words, explanation algorithms
can ignore or obscure critical relevant properties, creating incorrect or
misleading explanations. More broadly, we propose future research directions
for evaluating and generating explanations such that they are informative and
relevant from a fairness perspective.
- Abstract(参考訳): ブラックボックスモデルの説明が有用である場合、ブラックボックスの公平性もまたしばしば関連する問題である。
しかし,ブラックボックスモデルの公平さとブラックボックスの説明の振る舞いとの関係は明らかでない。
表型データセットに適用される説明に注目し,ブラックボックスアルゴリズムの公平性は必ずしも保持されないことを示唆する。
言い換えれば、説明アルゴリズムは重要な特性を無視したり無視したりすることができ、誤った説明や誤解を招く。
より広範に、フェアネスの観点から情報的かつ関連性の高い説明を評価・生成するための今後の研究方向を提案する。
関連論文リスト
- Does It Make Sense to Explain a Black Box With Another Black Box? [5.377278489623063]
文学における反現実的説明法の主な2つの家系、すなわち、(a)単語の追加、削除、置換によってターゲットを摂動させる非透明な方法、および(b)対象文書をその後に摂動が行われる非解釈可能な空間に投影するエンフォパク的アプローチである。
我々の実証的な証拠は、不透明なアプローチが、偽ニュースの検出や感情分析のような下流アプリケーションにとって過大なスキルであることを示している。
論文 参考訳(メタデータ) (2024-04-23T11:40:30Z) - DiConStruct: Causal Concept-based Explanations through Black-Box
Distillation [9.735426765564474]
本稿では,概念ベースと因果性の両方を考慮した説明手法であるDiConStructを提案する。
本報告では, ブラックボックス機械学習モデルに対する蒸留モデルとして, その予測を近似し, それぞれの説明を生成する。
論文 参考訳(メタデータ) (2024-01-16T17:54:02Z) - Learning with Explanation Constraints [91.23736536228485]
我々は、説明がモデルの学習をどのように改善するかを分析するための学習理論フレームワークを提供する。
我々は,多数の合成および実世界の実験に対して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T15:06:47Z) - Eliminating The Impossible, Whatever Remains Must Be True [46.39428193548396]
より簡潔な「なぜ」形式的な説明をするために背景知識を適用する方法を示す。
また,既存のルール誘導手法を用いて,データセットから背景情報を効率的に抽出する方法を示す。
論文 参考訳(メタデータ) (2022-06-20T03:18:14Z) - Characterizing the risk of fairwashing [8.545202841051582]
我々は,不公平度が低い高忠実度説明モデルを構築することが可能であることを示す。
公正な説明モデルが訴訟群を超えて一般化可能であることを示す。
フェアウォッシング攻撃はブラックボックスモデル間で伝達可能であると結論付けている。
論文 参考訳(メタデータ) (2021-06-14T15:33:17Z) - Contrastive Explanations for Model Interpretability [77.92370750072831]
分類モデルの対照的説明を生成する手法を提案する。
本手法は潜在空間へのモデル表現の投影に基づいている。
本研究は,モデル決定のより正確できめ細かな解釈性を提供するためのラベルコントラスト的説明の能力に光を当てた。
論文 参考訳(メタデータ) (2021-03-02T00:36:45Z) - Benchmarking and Survey of Explanation Methods for Black Box Models [9.747543620322956]
返された説明の種類に基づいて、説明方法の分類を提供します。
本稿では,最も最近広く使われている説明器を紹介し,説明の視覚的比較と定量的ベンチマークを示す。
論文 参考訳(メタデータ) (2021-02-25T18:50:29Z) - Explainers in the Wild: Making Surrogate Explainers Robust to
Distortions through Perception [77.34726150561087]
説明における歪みの影響を知覚距離を埋め込むことで評価する手法を提案する。
Imagenet-Cデータセットの画像の説明を生成し、サロゲート説明書の知覚距離を使用して歪んだ画像と参照画像のより一貫性のある説明を作成する方法を示しています。
論文 参考訳(メタデータ) (2021-02-22T12:38:53Z) - The Struggles of Feature-Based Explanations: Shapley Values vs. Minimal
Sufficient Subsets [61.66584140190247]
機能に基づく説明は、自明なモデルでも問題を引き起こすことを示す。
そこで本研究では,2つの一般的な説明書クラスであるシェープリー説明書と十分最小限の部分集合説明書が,基本的に異なる基底的説明書のタイプをターゲットにしていることを示す。
論文 参考訳(メタデータ) (2020-09-23T09:45:23Z) - Model extraction from counterfactual explanations [68.8204255655161]
本稿では, 敵が反実的説明によって提供された情報を利用して, 高精度かつ高精度なモデル抽出攻撃を構築する方法を示す。
我々の攻撃は、敵が相手モデルの忠実なコピーを、その偽説明にアクセスして作成することを可能にする。
論文 参考訳(メタデータ) (2020-09-03T19:02:55Z) - Considerations When Learning Additive Explanations for Black-Box Models [16.732047048577638]
ブラックボックスモデルの予測関数における非付加的成分を,異なる方法で特徴付ける方法を示す。
蒸留された説明は一般的に最も正確な付加的な説明であるが、木の説明のような非付加的な説明はより正確である傾向にある。
論文 参考訳(メタデータ) (2018-01-26T00:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。