論文の概要: Iterative Partial Fulfillment of Counterfactual Explanations: Benefits
and Risks
- arxiv url: http://arxiv.org/abs/2303.11111v1
- Date: Fri, 17 Mar 2023 14:41:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 15:17:22.701907
- Title: Iterative Partial Fulfillment of Counterfactual Explanations: Benefits
and Risks
- Title(参考訳): 対物的説明の反復的部分充足:利益とリスク
- Authors: Yilun Zhou
- Abstract要約: ファクトファクト(CF)の説明は、ハイテイクドメインにおける機械学習モデル予測を説明するのに人気がある。
CFの説明を受けると、被験者は新たな予測を下す前に部分的に満たすだけでよいことを示す。
我々は,異なるCFアルゴリズムがIPFの下では大きく異なる振る舞いを示し,その結果,被験者の福祉に異なる影響を示すことを示す。
- 参考スコア(独自算出の注目度): 2.7793394375935088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterfactual (CF) explanations, also known as contrastive explanations and
recourses, are popular for explaining machine learning model predictions in
high-stakes domains. For a subject that receives a negative model prediction
(e.g., mortgage application denial), they are similar instances but with
positive predictions, which informs the subject of ways to improve. Various
properties of CF explanations have been studied, such as validity, feasibility
and stability. In this paper, we contribute a novel aspect: their behaviors
under iterative partial fulfillment (IPF). Specifically, upon receiving a CF
explanation, the subject may only partially fulfills it before requesting a new
prediction with a new explanation, and repeat until the prediction is positive.
Such partial fulfillment could be due to the subject's limited capability
(e.g., can only pay down two out of four credit card accounts at this moment)
or an attempt to take the chance (e.g., betting that a monthly salary increase
of \$800 is enough even though \$1,000 is recommended). Does such iterative
partial fulfillment increase or decrease the total cost of improvement incurred
by the subject? We first propose a mathematical formalization of IPF and then
demonstrate, both theoretically and empirically, that different CF algorithms
exhibit vastly different behaviors under IPF and hence different effects on the
subject's welfare, warranting this factor to be considered in the studies of CF
algorithms. We discuss implications of our observations and give several
directions for future work.
- Abstract(参考訳): counterfactual(cf)による説明は、コントラスト的説明やリコースとしても知られ、高スループット領域における機械学習モデルの予測を説明するのに人気がある。
負のモデル予測を受ける被写体(例えば、住宅ローン申請拒否)は、同様の事例であるが、肯定的な予測を持ち、改善する方法を主題に通知する。
CF説明の妥当性、実現可能性、安定性など、様々な特性が研究されている。
本稿では,反復部分充足(ipf)下での行動について,新しい側面を提示する。
具体的には、CF説明を受けると、被験者は新たな説明で新しい予測を要求する前に部分的にそれを満たすだけで、予測が正になるまで繰り返すことができる。
このような部分的な充足は、対象者の限られた能力(例えば、現時点で4つのクレジットカードアカウントのうち2つしか払えない)や、チャンスを取る試み(例えば、1000ドルが推奨されているにもかかわらず、毎月の給与が800ドル上昇しても十分である)による可能性がある。
このような反復的な部分充足は、被験者による改善の総コストを増加させるか、減少させるか?
ipfの数学的形式化を最初に提案し、理論上および経験上、異なるcfアルゴリズムがipfの下で非常に異なる振る舞いを示し、それゆえ被験者の福祉に異なる効果を示すことを実証し、この因子をcfアルゴリズムの研究で考慮することを保証する。
我々は観察の意義を議論し、今後の研究に向けていくつかの方向性を示す。
関連論文リスト
- Counterfactual Fairness by Combining Factual and Counterfactual Predictions [18.950415688199993]
医療や雇用といった高度な分野において、意思決定における機械学習(ML)の役割は、かなりの公平さの懸念を提起する。
この研究は、あらゆる個人に対するMLモデルの結果が、異なる人口集団に属していた場合、変化しないべきであると仮定する対実公正(CF)に焦点を当てている。
本稿では,CFと予測性能のトレードオフをモデルに依存しない形で理論的に検討する。
論文 参考訳(メタデータ) (2024-09-03T15:21:10Z) - Counterfactual Influence in Markov Decision Processes [6.5535073117225195]
対実的および介入的分布の比較に基づく影響の形式的特徴化を導入する。
我々は、与えられた報酬構造に最適であるだけでなく、観察された経路に合わせて調整された反事実政策を導出する。
論文 参考訳(メタデータ) (2024-02-13T15:10:30Z) - Deep Backtracking Counterfactuals for Causally Compliant Explanations [57.94160431716524]
本稿では,DeepBC(Deep Backtracking counterfactuals)と呼ばれる手法を導入する。
特別な場合として、我々の定式化は、対実的説明の分野における手法に還元される。
論文 参考訳(メタデータ) (2023-10-11T17:11:10Z) - Faithful Explanations of Black-box NLP Models Using LLM-generated
Counterfactuals [67.64770842323966]
NLPシステムの予測に関する因果的説明は、安全性を確保し、信頼を確立するために不可欠である。
既存の手法は、しばしばモデル予測を効果的または効率的に説明できない。
本稿では, 対物近似(CF)の2つの手法を提案する。
論文 参考訳(メタデータ) (2023-10-01T07:31:04Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - CounterNet: End-to-End Training of Prediction Aware Counterfactual
Explanations [12.313007847721215]
CounterNetは、予測モデルトレーニングと対実的(CF)説明の生成を統合する、エンドツーエンドの学習フレームワークである。
ポストホック法とは異なり、CounterNetは予測モデルとともにCF説明生成を1回だけ最適化することができる。
複数の実世界のデータセットに対する実験により、CounterNetは高品質な予測を生成することが示された。
論文 参考訳(メタデータ) (2021-09-15T20:09:13Z) - Direct Advantage Estimation [63.52264764099532]
予測されるリターンは、学習を遅くする可能性のある望ましくない方法でポリシーに依存する可能性があることを示します。
本稿では,優位関数をモデル化し,データから直接推定する手法として,DAE(Direct Advantage Estimation)を提案する。
望むなら、値関数をDAEにシームレスに統合して、時間差学習と同様の方法で更新することもできる。
論文 参考訳(メタデータ) (2021-09-13T16:09:31Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Counterfactual Explanations Can Be Manipulated [40.78019510022835]
反事実的説明の脆弱性を記述した最初のフレームワークを紹介し,その操作方法を示す。
反事実的説明は、それらが堅牢でないことを示す小さな摂動の下で、大きく異なる反事実に収束する可能性がある。
これらのモデルが、監査者に対して公正に見せながら、データ内の特定のサブグループに対して、不公平に低コストなリコースを提供する方法について説明する。
論文 参考訳(メタデータ) (2021-06-04T18:56:15Z) - On the Reproducibility of Neural Network Predictions [52.47827424679645]
そこで本研究では, チャーン問題について検討し, 原因因子を同定し, 緩和する2つの簡単な方法を提案する。
最初に、標準的な画像分類タスクであっても、チャーンが問題であることを示す。
我々は,予測信頼度を高めるために,エントロピー正規化器を提案する。
両手法の有効性を実証的に示し, 基礎モデルの精度を向上しながら, チャーン低減効果を示す。
論文 参考訳(メタデータ) (2021-02-05T18:51:01Z) - Towards Unifying Feature Attribution and Counterfactual Explanations:
Different Means to the Same End [17.226134854746267]
本稿では,一組の反実例から特徴帰属説明を生成する手法を提案する。
本報告では, 帰属に基づく説明の妥当性を, その必要性と充足性の観点から評価するために, 対実例をいかに活用するかを示す。
論文 参考訳(メタデータ) (2020-11-10T05:41:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。