論文の概要: An Efficient Shapley Value Computation for the Naive Bayes Classifier
- arxiv url: http://arxiv.org/abs/2307.16718v1
- Date: Mon, 31 Jul 2023 14:39:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 14:01:07.326962
- Title: An Efficient Shapley Value Computation for the Naive Bayes Classifier
- Title(参考訳): ネイブベイズ分類器のShapley値の効率的な計算法
- Authors: Vincent Lemaire, Fabrice Cl\'erot and Marc Boull\'e
- Abstract要約: 本稿では, 単純ベイズ分類器の場合のShapley値の正確な解析式を提案する。
以上の結果から,本提案はアルゴリズムの複雑さを低く抑えた有意な結果をもたらすことが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variable selection or importance measurement of input variables to a machine
learning model has become the focus of much research. It is no longer enough to
have a good model, one also must explain its decisions. This is why there are
so many intelligibility algorithms available today. Among them, Shapley value
estimation algorithms are intelligibility methods based on cooperative game
theory. In the case of the naive Bayes classifier, and to our knowledge, there
is no ``analytical" formulation of Shapley values. This article proposes an
exact analytic expression of Shapley values in the special case of the naive
Bayes Classifier. We analytically compare this Shapley proposal, to another
frequently used indicator, the Weight of Evidence (WoE) and provide an
empirical comparison of our proposal with (i) the WoE and (ii) KernelShap
results on real world datasets, discussing similar and dissimilar results. The
results show that our Shapley proposal for the naive Bayes classifier provides
informative results with low algorithmic complexity so that it can be used on
very large datasets with extremely low computation time.
- Abstract(参考訳): 機械学習モデルに対する入力変数の選択や重要度の測定は、多くの研究の焦点となっている。
よいモデルを持つにはもはや十分ではなく、その決定を説明する必要がある。
そのため、今日では多くの知性アルゴリズムが利用可能である。
中でも,共有値推定アルゴリズムは協調ゲーム理論に基づく知性評価手法である。
単純ベイズ分類器や我々の知識の場合には、シェープリー値の「解析的」な定式化は存在しない。
本稿では,ベイズ分類器の特殊ケースにおけるシェープリー値の正確な解析式を提案する。
我々は,このシェープリーの提案を,よく使われる他の指標である証拠重み(woe)と比較し,提案を実証的に比較する。
(i)WoEとWoE
(ii)kernelshapは実世界のデータセットで結果し、類似し異な結果について論じる。
その結果,ベイズ分類器に対するShapleyの提案は,アルゴリズムの複雑さの低い情報的結果を提供し,計算時間を極端に低い大規模データセットで利用できることを示した。
関連論文リスト
- Accelerated Shapley Value Approximation for Data Evaluation [3.707457963532597]
機械学習問題の構造的特性を活用することにより,データポイントのシェープ値をより効率的に近似できることを示す。
我々の分析は、データバリュエーションの文脈において、小さなサブセットで訓練されたモデルはより重要であることを示唆している。
論文 参考訳(メタデータ) (2023-11-09T13:15:36Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - PDD-SHAP: Fast Approximations for Shapley Values using Functional
Decomposition [2.0559497209595823]
我々は、ANOVAに基づく関数分解モデルを用いて説明中のブラックボックスモデルを近似するアルゴリズムであるPDD-SHAPを提案する。
これにより、Shapleyの値を既存の大規模データセットの手法よりも桁違いに高速に計算でき、Shapleyの計算コストを大幅に削減できる。
論文 参考訳(メタデータ) (2022-08-26T11:49:54Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - The Shapley Value of Classifiers in Ensemble Games [7.23389716633927]
この質問に答えるために、移動可能なユーティリティ協力ゲームの新しいクラスを紹介します。
アンサンブルゲームのプレイヤーは、データセットからポイントを正しくラベル付けするためにアンサンブルで協力する事前訓練されたバイナリ分類器です。
我々は,アンサンブルゲームのShapley値に基づいて,個々のモデルのペイオフを指定するスケーラブルなアルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-01-06T17:40:23Z) - A Multilinear Sampling Algorithm to Estimate Shapley Values [4.771833920251869]
ゲーム理論に適用したマルチ線形拡張手法に基づく新しいサンプリング手法を提案する。
本手法は任意の機械学習モデル,特に多クラス分類や回帰問題に適用可能である。
論文 参考訳(メタデータ) (2020-10-22T21:47:16Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。