論文の概要: Beyond TreeSHAP: Efficient Computation of Any-Order Shapley Interactions
for Tree Ensembles
- arxiv url: http://arxiv.org/abs/2401.12069v1
- Date: Mon, 22 Jan 2024 16:08:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 13:22:40.167980
- Title: Beyond TreeSHAP: Efficient Computation of Any-Order Shapley Interactions
for Tree Ensembles
- Title(参考訳): TreeSHAPを超える: ツリーアンサンブルのための任意の順序の共有相互作用の効率的な計算
- Authors: Maximilian Muschalik, Fabian Fumagalli, Barbara Hammer, Eyke
H\"ullermeier
- Abstract要約: シェープリー値(Shapley value, SV)は、予測の付加的特徴属性を定量化するための説明可能な人工知能(XAI)研究における概念である。
TreeSHAP-IQは木モデル予測のための任意の順序加法シャプリー相互作用を効率的に計算する手法である。
- 参考スコア(独自算出の注目度): 6.664930499708017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While shallow decision trees may be interpretable, larger ensemble models
like gradient-boosted trees, which often set the state of the art in machine
learning problems involving tabular data, still remain black box models. As a
remedy, the Shapley value (SV) is a well-known concept in explainable
artificial intelligence (XAI) research for quantifying additive feature
attributions of predictions. The model-specific TreeSHAP methodology solves the
exponential complexity for retrieving exact SVs from tree-based models.
Expanding beyond individual feature attribution, Shapley interactions reveal
the impact of intricate feature interactions of any order. In this work, we
present TreeSHAP-IQ, an efficient method to compute any-order additive Shapley
interactions for predictions of tree-based models. TreeSHAP-IQ is supported by
a mathematical framework that exploits polynomial arithmetic to compute the
interaction scores in a single recursive traversal of the tree, akin to Linear
TreeSHAP. We apply TreeSHAP-IQ on state-of-the-art tree ensembles and explore
interactions on well-established benchmark datasets.
- Abstract(参考訳): 浅い決定木は解釈可能であるが、勾配木のような大きなアンサンブルモデルは、表層データを含む機械学習の問題でしばしば最先端となるが、依然としてブラックボックスモデルのままである。
救済として、Shapley値(SV)は、予測の付加的特徴属性を定量化するための説明可能な人工知能(XAI)研究においてよく知られた概念である。
モデル固有のTreeSHAP手法は、ツリーベースモデルから正確なSVを取得するための指数関数的な複雑さを解決する。
個々の特徴の帰属を超えて、シャプリー相互作用は任意の順序の複雑な特徴の相互作用の影響を明らかにする。
本研究では,木モデル予測のための任意の順序加法シャプリー相互作用の効率的な計算法であるTreeSHAP-IQを提案する。
TreeSHAP-IQ は、線形木SHAP と同様に、木の1つの再帰的トラバースの相互作用スコアを計算するために多項式演算を利用する数学的フレームワークによってサポートされている。
我々は,最先端ツリーアンサンブルにtreeshap-iqを適用し,確立されたベンチマークデータセット上でのインタラクションを探索する。
関連論文リスト
- Terminating Differentiable Tree Experts [77.2443883991608]
本稿では,変圧器と表現生成器の組み合わせを用いて木操作を学習するニューラルシンボリック微分木機械を提案する。
まず、専門家の混在を導入することで、各ステップで使用される一連の異なるトランスフォーマーレイヤを取り除きます。
また,モデルが自動生成するステップ数を選択するための新しい終端アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-02T08:45:38Z) - An efficient solution to Hidden Markov Models on trees with coupled branches [0.0]
木上の隠れモデル(HMM)のフレームワークを拡張して、データのツリーのような構造が結合されたブランチを含むシナリオに対処する。
本研究では,木系HMMと分岐した分岐木に対する確率,復号化,パラメータ学習問題を効率的に解くプログラミングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-06-03T18:00:00Z) - On marginal feature attributions of tree-based models [0.11184789007828977]
辺縁的なシャプリー、オーウェンまたはバンジャフの値など、辺縁的な期待に基づく局所的な特徴属性を用いることができる。
パス依存(path-dependent)のTreeSHAPが特徴のランク付けを行うのと全く同じ関数を計算する2つの(統計的に類似した)決定木を提示する。
我々は、CataBoostモデルの余剰Shapley(およびBanzhafとOwen)値についてのみ、複雑さを改善し、内部モデルパラメータの観点からのみ、明示的な式を導出するために対称性を利用する。
論文 参考訳(メタデータ) (2023-02-16T17:18:03Z) - Unboxing Tree Ensembles for interpretability: a hierarchical
visualization tool and a multivariate optimal re-built tree [0.34530027457862006]
我々は,木組モデルの解釈可能な表現を開発し,その振る舞いに関する貴重な洞察を提供する。
提案モデルは,木組決定関数を近似した浅い解釈可能な木を得るのに有効である。
論文 参考訳(メタデータ) (2023-02-15T10:43:31Z) - SETAR-Tree: A Novel and Accurate Tree Algorithm for Global Time Series
Forecasting [7.206754802573034]
本稿では,TARモデルと回帰木との密接な関係について検討する。
本研究では,葉のグローバルプール回帰(PR)モデルをトレーニングする,予測固有木アルゴリズムを提案する。
本評価では, 提案した樹木モデルと森林モデルを用いて, 最先端の樹木モデルよりも精度の高い木モデルを提案する。
論文 参考訳(メタデータ) (2022-11-16T04:30:42Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - Evaluating Tree Explanation Methods for Anomaly Reasoning: A Case Study
of SHAP TreeExplainer and TreeInterpreter [6.718611456024702]
木に基づくモデルを記述するための2つの手法-木インタープリタ(TI)とシャプレー付加例木説明器(SHAP-TE)-の性能について検討する。
SHAP-TEはTI上での整合性を保証するが,計算量の増加を犠牲にすることで,このケーススタディでは必ずしも整合性は向上しないことがわかった。
論文 参考訳(メタデータ) (2020-10-13T23:18:26Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。