論文の概要: SHAFF: Fast and consistent SHApley eFfect estimates via random Forests
- arxiv url: http://arxiv.org/abs/2105.11724v1
- Date: Tue, 25 May 2021 07:48:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-26 14:28:04.061505
- Title: SHAFF: Fast and consistent SHApley eFfect estimates via random Forests
- Title(参考訳): SHAFF: ランダム森林による高速で一貫したSHApley eFfectの推定
- Authors: Cl\'ement B\'enard (LPSM), G\'erard Biau (LPSM), S\'ebastien da Veiga,
Erwan Scornet (CMAP)
- Abstract要約: 入力変数が依存している場合でも、高速で正確なシェープ効果推定であるSHAFFを導入する。
C++とRにおけるSHAFFの実装はオンラインで入手できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interpretability of learning algorithms is crucial for applications involving
critical decisions, and variable importance is one of the main interpretation
tools. Shapley effects are now widely used to interpret both tree ensembles and
neural networks, as they can efficiently handle dependence and interactions in
the data, as opposed to most other variable importance measures. However,
estimating Shapley effects is a challenging task, because of the computational
complexity and the conditional expectation estimates. Accordingly, existing
Shapley algorithms have flaws: a costly running time, or a bias when input
variables are dependent. Therefore, we introduce SHAFF, SHApley eFfects via
random Forests, a fast and accurate Shapley effect estimate, even when input
variables are dependent. We show SHAFF efficiency through both a theoretical
analysis of its consistency, and the practical performance improvements over
competitors with extensive experiments. An implementation of SHAFF in C++ and R
is available online.
- Abstract(参考訳): 学習アルゴリズムの解釈可能性は重要な決定を伴うアプリケーションにとって重要であり、変数の重要性は主要な解釈ツールの1つである。
シェープ効果は、他のほとんどの可変重要度尺度とは対照的に、データ内の依存や相互作用を効率的に処理できるため、ツリーアンサンブルとニューラルネットワークの両方を解釈するために広く使用されている。
しかし、シャプリー効果の推定は計算の複雑さと条件付き期待値の見積もりのために難しい課題である。
したがって、既存のshapleyアルゴリズムには、コストのかかる実行時間や入力変数に依存するバイアスという欠陥がある。
そこで,SHAFF,SHApley eFfects via random Forests, a fast and accurate Shapley effect estimates, if if input variables are dependent。
我々は,SHAFFの効率を,その整合性の理論的解析と,広範に実験を行った競合相手に対する実用的性能改善の両面から示す。
C++とRにおけるSHAFFの実装はオンラインで入手できる。
関連論文リスト
- Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-11T13:44:49Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - An Efficient Shapley Value Computation for the Naive Bayes Classifier [0.0]
本稿では, 単純ベイズ分類器の場合のShapley値の正確な解析式を提案する。
以上の結果から,本提案はアルゴリズムの複雑さを低く抑えた有意な結果をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-07-31T14:39:10Z) - Understanding Interventional TreeSHAP : How and Why it Works [0.0]
我々は、なぜInterventional TreeSHAPが機能するのかを正式に証明する。
特に,Interventional TreeSHAPの証明はShapley-Taylorインデックスに容易に適用できる。
論文 参考訳(メタデータ) (2022-09-29T22:38:56Z) - Shapley-NAS: Discovering Operation Contribution for Neural Architecture
Search [96.20505710087392]
ニューラルアーキテクチャ探索のための演算寄与度(Shapley-NAS)を評価するためのShapley値に基づく手法を提案する。
提案手法は,光探索コストに比例して最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-20T14:41:49Z) - Performance and Interpretability Comparisons of Supervised Machine
Learning Algorithms: An Empirical Study [3.7881729884531805]
論文は発見に基づく方法で整理され、各セクションが一般的な結論を提供する。
全体として、XGBとFFNNは競争力があり、FFNNはスムーズなモデルでより良いパフォーマンスを示した。
RFは一般には良好に機能せず,文献で確認された。
論文 参考訳(メタデータ) (2022-04-27T12:04:33Z) - Simple Stochastic and Online Gradient DescentAlgorithms for Pairwise
Learning [65.54757265434465]
ペアワイズ学習(Pairwise learning)とは、損失関数がペアインスタンスに依存するタスクをいう。
オンライン降下(OGD)は、ペアワイズ学習でストリーミングデータを処理する一般的なアプローチである。
本稿では,ペアワイズ学習のための手法について,シンプルでオンラインな下降を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:10:48Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。
影響評価は浅いネットワークでは かなり正確です
ヘッセン正則化は、高品質な影響推定を得るために重要である。
論文 参考訳(メタデータ) (2020-06-25T18:25:59Z) - Trees, forests, and impurity-based variable importance [0.0]
MDI(Mean Decrease Impurity)という2つのよく知られたランダムな森林変動の重要度を分析した。
入力変数が独立であり、相互作用がない場合、MDIは出力の分散分解を提供する。
分析の結果,単木に比べて森林の利用にはいくつかの利点がある可能性が示唆された。
論文 参考訳(メタデータ) (2020-01-13T14:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。