論文の概要: Provably Stable Feature Rankings with SHAP and LIME
- arxiv url: http://arxiv.org/abs/2401.15800v1
- Date: Sun, 28 Jan 2024 23:14:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 16:24:47.161882
- Title: Provably Stable Feature Rankings with SHAP and LIME
- Title(参考訳): SHAPとLIMEによる安定した特徴ランク付け
- Authors: Jeremy Goldwasser and Giles Hooker
- Abstract要約: SHAPやLIMEなどの入力変数のスコアリング方法は、ランダムサンプリングによる不安定性が高い。
最も重要な特徴を高い確率で正しくランク付けする属性法を考案する。
- 参考スコア(独自算出の注目度): 4.565151144070748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature attributions are ubiquitous tools for understanding the predictions
of machine learning models. However, popular methods for scoring input
variables such as SHAP and LIME suffer from high instability due to random
sampling. Leveraging ideas from multiple hypothesis testing, we devise
attribution methods that correctly rank the most important features with high
probability. Our algorithm RankSHAP guarantees that the $K$ highest Shapley
values have the proper ordering with probability exceeding $1-\alpha$.
Empirical results demonstrate its validity and impressive computational
efficiency. We also build on previous work to yield similar results for LIME,
ensuring the most important features are selected in the right order.
- Abstract(参考訳): 特徴属性は、機械学習モデルの予測を理解するためのユビキタスツールである。
しかし、shapやlimeなどの入力変数をスコアリングする一般的な方法は、ランダムサンプリングによる不安定度が高い。
複数の仮説テストからアイデアを活用し、最も重要な特徴を高い確率で正しくランク付けする帰属法を考案する。
我々のアルゴリズム RankSHAP は、最高シェープ値が 1-\alpha$ を超える確率で正しい順序を持つことを保証している。
実証的な結果は、その妥当性と印象的な計算効率を示している。
我々はまた、LIMEの同様の結果を得るために、以前の作業に基づいて構築し、最も重要な機能が正しい順序で選択されることを保証します。
関連論文リスト
- Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - An Efficient Shapley Value Computation for the Naive Bayes Classifier [0.0]
本稿では, 単純ベイズ分類器の場合のShapley値の正確な解析式を提案する。
以上の結果から,本提案はアルゴリズムの複雑さを低く抑えた有意な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-07-31T14:39:10Z) - SHAP@k:Efficient and Probably Approximately Correct (PAC) Identification
of Top-k Features [16.99004256148679]
本稿では,トップk識別問題(TkIP)を紹介し,最も高いSHAP値を持つk特徴を特定することを目的とする。
我々の研究の目的は、TkIP解決の文脈において、既存の手法のサンプル効率を改善することである。
論文 参考訳(メタデータ) (2023-07-10T18:42:45Z) - Shapley Value on Probabilistic Classifiers [6.163093930860032]
機械学習(ML)の文脈では、データ評価手法は、MLモデルの実用性に対する各データポイントの寄与を公平に測定することを目的としている。
従来のShapleyベースのデータ評価手法は、有益と有害なトレーニングデータポイントを効果的に区別するものではない。
確率的効用関数を構成することにより確率的シェープ(P-Shapley)値を提案する。
論文 参考訳(メタデータ) (2023-06-12T15:09:13Z) - Self-Evaluation Guided Beam Search for Reasoning [61.523627290397556]
我々は,Large Language Model (LLM) の推論プロセスのガイドと校正を行うための段階的自己評価機構を導入する。
本稿では,ビームサーチによる自己評価ガイダンスを統合した復号アルゴリズムを提案する。
我々のアプローチは、GSM8K、AQuA、StrategyQAにおいて、対応するCodexバックボンドベースラインをわずかに精度6.34%、9.56%、および5.46%で上回る。
論文 参考訳(メタデータ) (2023-05-01T02:37:59Z) - Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。
$nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文 参考訳(メタデータ) (2022-12-26T15:13:13Z) - A $k$-additive Choquet integral-based approach to approximate the SHAP
values for local interpretability in machine learning [8.637110868126546]
本稿では,Shapley値に基づく機械学習モデルに対する解釈可能性の提供を目的とする。
Kernel SHAPと呼ばれるSHAPベースの手法は、計算労力を少なくしてそのような値を近似する効率的な戦略を採用する。
得られた結果から,提案手法ではSHAP値に近似するために属性の連立性に関する計算がより少ないことが確認された。
論文 参考訳(メタデータ) (2022-11-03T22:34:50Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Provably Efficient Reward-Agnostic Navigation with Linear Value
Iteration [143.43658264904863]
我々は、最小二乗値スタイルのアルゴリズムで一般的に使用される、より標準的なベルマン誤差の概念の下での反復が、ほぼ最適値関数の学習において強力なPAC保証を提供することを示す。
そこで本稿では,任意の(線形な)報酬関数に対して,最適に近いポリシーを学習するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-08-18T04:34:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。