論文の概要: From Decision Trees to Boolean Logic: A Fast and Unified SHAP Algorithm
- arxiv url: http://arxiv.org/abs/2511.09376v1
- Date: Thu, 13 Nov 2025 01:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.54137
- Title: From Decision Trees to Boolean Logic: A Fast and Unified SHAP Algorithm
- Title(参考訳): 決定木からブール論理へ:高速かつ統一的なSHAPアルゴリズム
- Authors: Alexander Nadel, Ron Wettenstein,
- Abstract要約: 我々は、決定木、ゲーム理論、ブール論理を統一したフレームワークに統合するSHAPアルゴリズムであるWOODELFを紹介する。
WoodELFはCPUやGPUのハードウェアでも効率的に動作するように設計されている。
- 参考スコア(独自算出の注目度): 45.88028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SHapley Additive exPlanations (SHAP) is a key tool for interpreting decision tree ensembles by assigning contribution values to features. It is widely used in finance, advertising, medicine, and other domains. Two main approaches to SHAP calculation exist: Path-Dependent SHAP, which leverages the tree structure for efficiency, and Background SHAP, which uses a background dataset to estimate feature distributions. We introduce WOODELF, a SHAP algorithm that integrates decision trees, game theory, and Boolean logic into a unified framework. For each consumer, WOODELF constructs a pseudo-Boolean formula that captures their feature values, the structure of the decision tree ensemble, and the entire background dataset. It then leverages this representation to compute Background SHAP in linear time. WOODELF can also compute Path-Dependent SHAP, Shapley interaction values, Banzhaf values, and Banzhaf interaction values. WOODELF is designed to run efficiently on CPU and GPU hardware alike. Available via the WOODELF Python package, it is implemented using NumPy, SciPy, and CuPy without relying on custom C++ or CUDA code. This design enables fast performance and seamless integration into existing frameworks, supporting large-scale computation of SHAP and other game-theoretic values in practice. For example, on a dataset with 3,000,000 rows, 5,000,000 background samples, and 127 features, WOODELF computed all Background Shapley values in 162 seconds on CPU and 16 seconds on GPU - compared to 44 minutes required by the best method on any hardware platform, representing 16x and 165x speedups, respectively.
- Abstract(参考訳): SHAP(SHapley Additive ExPlanations)は、機能へのコントリビューション値を割り当てることで、決定ツリーのアンサンブルを解釈するための重要なツールである。
金融、広告、医療などの分野で広く使われている。
SHAP計算には2つの主要なアプローチがある:Path-Dependent SHAP、背景データセットを用いて特徴分布を推定するバックグラウンドSHAP。
我々は、決定木、ゲーム理論、ブール論理を統一したフレームワークに統合するSHAPアルゴリズムであるWOODELFを紹介する。
各コンシューマに対して、WOODELFは、機能値、決定ツリーアンサンブルの構造、バックグラウンドデータセット全体をキャプチャする擬似ブール式を構築する。
次に、この表現を利用してバックグラウンドSHAPを線形時間で計算する。
WOODELFはPath-Dependent SHAP、Shapleyインタラクション値、Banzhaf値、Banzhafインタラクション値も計算できる。
WOODELFはCPUやGPUのハードウェアでも効率的に動作するように設計されている。
WOODELF Pythonパッケージを通じて利用可能であり、カスタムC++やCUDAコードに頼ることなく、NumPy、SciPy、CuPyを使って実装されている。
この設計は、既存のフレームワークへの高速なパフォーマンスとシームレスな統合を可能にし、SHAPや他のゲーム理論値の大規模計算をサポートする。
例えば、3000,000行、5,000,000のバックグラウンドサンプル、127の機能を持つデータセットでは、WOODELFは、CPUで162秒、GPUで16秒ですべてのバックグラウンドシェープ値を計算する。
関連論文リスト
- TreePO: Bridging the Gap of Policy Optimization and Efficacy and Inference Efficiency with Heuristic Tree-based Modeling [65.46347858249295]
TreePOは自己誘導型ロールアウトアルゴリズムで、シーケンス生成を木構造検索プロセスとして見る。
TreePOは基本的に、探索の多様性を保存または強化しながら、更新毎の計算負担を削減します。
論文 参考訳(メタデータ) (2025-08-24T16:52:37Z) - Fast unsupervised ground metric learning with tree-Wasserstein distance [14.235762519615175]
教師なしの地上距離学習アプローチが導入されました
一つの有望な選択肢はワッサーシュタイン特異ベクトル(WSV)であり、特徴量とサンプルの間の最適な輸送距離を同時に計算する際に現れる。
木にサンプルや特徴を埋め込むことでWSV法を強化し,木-ワッサーシュタイン距離(TWD)を計算することを提案する。
論文 参考訳(メタデータ) (2024-11-11T23:21:01Z) - Scaling LLM Inference with Optimized Sample Compute Allocation [56.524278187351925]
我々は、異なる推論構成の最適な混合を見つけるアルゴリズムであるOSCAを提案する。
実験の結果,学習した混合アロケーションでは,最高の単一構成よりも精度がよいことがわかった。
OSCAはシングルターンタスク以外のエージェント処理にも有効であることが示されており、デフォルト設定よりも3倍少ない計算でSWE-Benchの精度が向上している。
論文 参考訳(メタデータ) (2024-10-29T19:17:55Z) - SHAP values via sparse Fourier representation [31.824587432702057]
SHAP(SHapley Additive exPlanations)値は、解釈可能で説明可能なAIにおいて、局所的特徴属性の広く用いられる方法である。
ブラックボックス設定とツリーベースモデルの両方において、SHAP値を計算するための効率的な2段階アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-08T19:05:50Z) - Improving the Weighting Strategy in KernelSHAP [0.8057006406834466]
説明可能なAI(XAI)では、Shapley値が、複雑な機械学習モデルによる予測を説明する一般的なフレームワークである。
本稿では,結果のShapley値近似のばらつきを低減するために,決定論的重みを1つに置き換えるKernelSHAPの新たな改良を提案する。
提案手法は, 近似したShapley値と同じ精度を保ちながら, 必要なコントリビューション関数の評価を5%$から50%$に削減することができる。
論文 参考訳(メタデータ) (2024-10-07T10:02:31Z) - Simulation-based inference with the Python Package sbijax [0.7499722271664147]
sbijaxは、ニューラルネットワークベースの推論に様々な最先端のメソッドを実装するPythonパッケージである。
このパッケージはベイズ近似計算の機能を提供し、モデル診断を計算し、自動的に要約統計を推定する。
論文 参考訳(メタデータ) (2024-09-28T18:47:13Z) - Shapley-NAS: Discovering Operation Contribution for Neural Architecture
Search [96.20505710087392]
ニューラルアーキテクチャ探索のための演算寄与度(Shapley-NAS)を評価するためのShapley値に基づく手法を提案する。
提案手法は,光探索コストに比例して最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-20T14:41:49Z) - AdaPool: Exponential Adaptive Pooling for Information-Retaining
Downsampling [82.08631594071656]
畳み込み層は畳み込みニューラルネットワーク(CNN)の重要な構成要素である
適応的で指数関数的に重み付けされたアダプール法を提案する。
adaPoolは画像やビデオの分類やオブジェクト検出など,さまざまなタスクを通じて,ディテールの保存性の向上を実証する。
論文 参考訳(メタデータ) (2021-11-01T08:50:37Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z) - GPUTreeShap: Massively Parallel Exact Calculation of SHAP Scores for
Tree Ensembles [0.8057006406834467]
本稿では,グラフィック処理ユニット上での大規模並列計算に適したツリーサップアルゴリズムを提案する。
我々は,最先端のマルチコアCPU実装を用いて,SHAP値の最大19倍,SHAP値の最大340倍の高速化を実現する。
論文 参考訳(メタデータ) (2020-10-27T00:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。