論文の概要: A Multilinear Sampling Algorithm to Estimate Shapley Values
- arxiv url: http://arxiv.org/abs/2010.12082v1
- Date: Thu, 22 Oct 2020 21:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 05:49:47.654104
- Title: A Multilinear Sampling Algorithm to Estimate Shapley Values
- Title(参考訳): シェープ値推定のためのマルチ線形サンプリングアルゴリズム
- Authors: Ramin Okhrati and Aldo Lipani
- Abstract要約: ゲーム理論に適用したマルチ線形拡張手法に基づく新しいサンプリング手法を提案する。
本手法は任意の機械学習モデル,特に多クラス分類や回帰問題に適用可能である。
- 参考スコア(独自算出の注目度): 4.771833920251869
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shapley values are great analytical tools in game theory to measure the
importance of a player in a game. Due to their axiomatic and desirable
properties such as efficiency, they have become popular for feature importance
analysis in data science and machine learning. However, the time complexity to
compute Shapley values based on the original formula is exponential, and as the
number of features increases, this becomes infeasible. Castro et al. [1]
developed a sampling algorithm, to estimate Shapley values. In this work, we
propose a new sampling method based on a multilinear extension technique as
applied in game theory. The aim is to provide a more efficient (sampling)
method for estimating Shapley values. Our method is applicable to any machine
learning model, in particular for either multi-class classifications or
regression problems. We apply the method to estimate Shapley values for
multilayer perceptrons (MLPs) and through experimentation on two datasets, we
demonstrate that our method provides more accurate estimations of the Shapley
values by reducing the variance of the sampling statistics.
- Abstract(参考訳): シャプリーの値はゲーム理論における優れた分析ツールであり、ゲームにおけるプレイヤーの重要性を測定する。
効率性などの公理的で望ましい性質のため、データサイエンスや機械学習における特徴的重要性の分析で人気を博している。
しかし、元の式に基づいてShapley値を計算する時間の複雑さは指数関数的であり、特徴の数が増加するにつれて、これは実現不可能となる。
カストロとアル。
[1]はShapley値を推定するサンプリングアルゴリズムを開発した。
本研究では,ゲーム理論に適用される多重線形拡張手法に基づく新しいサンプリング手法を提案する。
目的は、Shapley値をより効率的に(サンプリング)する方法を提供することである。
本手法は任意の機械学習モデル,特に多クラス分類や回帰問題に適用可能である。
本手法は多層パーセプトロン (mlps) のシャプリー値の推定に応用し, 2つのデータセットを用いた実験により, サンプリング統計のばらつきを低減し, シャプリー値の高精度な推定を実現することを実証した。
関連論文リスト
- Improving the Sampling Strategy in KernelSHAP [0.8057006406834466]
KernelSHAPフレームワークは、重み付けされた条件付き期待値のサンプルサブセットを用いて、Shapley値の近似を可能にする。
本稿では,現在最先端戦略における重みの分散を低減するための安定化手法,サンプルサブセットに基づいてShapleyカーネル重みを補正する新しい重み付け方式,および重要なサブセットを包含して修正されたShapleyカーネル重みと統合する簡単な戦略を提案する。
論文 参考訳(メタデータ) (2024-10-07T10:02:31Z) - Accelerated Shapley Value Approximation for Data Evaluation [3.707457963532597]
機械学習問題の構造的特性を活用することにより,データポイントのシェープ値をより効率的に近似できることを示す。
我々の分析は、データバリュエーションの文脈において、小さなサブセットで訓練されたモデルはより重要であることを示唆している。
論文 参考訳(メタデータ) (2023-11-09T13:15:36Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - An Efficient Shapley Value Computation for the Naive Bayes Classifier [0.0]
本稿では, 単純ベイズ分類器の場合のShapley値の正確な解析式を提案する。
以上の結果から,本提案はアルゴリズムの複雑さを低く抑えた有意な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-07-31T14:39:10Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Efficient computation and analysis of distributional Shapley values [15.322542729755998]
線形回帰、二項分類、非パラメトリック密度推定の標準問題に対するDShapleyの最初の解析式を導出する。
我々の公式は直接解釈可能であり、異なる種類のデータに対してどのように値が変化するかについての定量的な洞察を提供する。
論文 参考訳(メタデータ) (2020-07-02T19:51:54Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。