論文の概要: Fast Estimation of Partial Dependence Functions using Trees
- arxiv url: http://arxiv.org/abs/2410.13448v1
- Date: Thu, 17 Oct 2024 11:21:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:21:42.844290
- Title: Fast Estimation of Partial Dependence Functions using Trees
- Title(参考訳): 木を用いた部分依存関数の高速推定
- Authors: Jinyang Liu, Tessa Steensgaard, Marvin N. Wright, Niklas Pfister, Munir Hiabu,
- Abstract要約: 我々は,任意の部分依存関数を効率的に推定する木に基づく新しい推定器,textttFastPDを提案する。
任意の特徴部分集合に対するPD関数を推定することにより、 textttFastPD は SHAP や PD プロット、高次相互作用効果などの PD ベースの解釈を抽出することができる。
- 参考スコア(独自算出の注目度): 5.962392128252415
- License:
- Abstract: Many existing interpretation methods are based on Partial Dependence (PD) functions that, for a pre-trained machine learning model, capture how a subset of the features affects the predictions by averaging over the remaining features. Notable methods include Shapley additive explanations (SHAP) which computes feature contributions based on a game theoretical interpretation and PD plots (i.e., 1-dim PD functions) that capture average marginal main effects. Recent work has connected these approaches using a functional decomposition and argues that SHAP values can be misleading since they merge main and interaction effects into a single local effect. A major advantage of SHAP compared to other PD-based interpretations, however, has been the availability of fast estimation techniques, such as \texttt{TreeSHAP}. In this paper, we propose a new tree-based estimator, \texttt{FastPD}, which efficiently estimates arbitrary PD functions. We show that \texttt{FastPD} consistently estimates the desired population quantity -- in contrast to path-dependent \texttt{TreeSHAP} which is inconsistent when features are correlated. For moderately deep trees, \texttt{FastPD} improves the complexity of existing methods from quadratic to linear in the number of observations. By estimating PD functions for arbitrary feature subsets, \texttt{FastPD} can be used to extract PD-based interpretations such as SHAP, PD plots and higher order interaction effects.
- Abstract(参考訳): 多くの既存の解釈手法は部分依存(PD)関数に基づいており、事前訓練された機械学習モデルでは、機能のサブセットが残りの機能の平均化によって予測にどう影響するかをキャプチャする。
注目すべき方法は、ゲーム理論の解釈に基づいて特徴貢献を計算するShapley additive explanations (SHAP) と、平均的な限界主効果をキャプチャするPDプロット (1-dim PD function) である。
最近の研究はこれらのアプローチを機能的分解を用いて結びつけており、SHAP値は主効果と相互作用効果を一つの局所効果にマージするので誤解を招く可能性があると主張している。
しかし、他のPDベースの解釈と比較してSHAPの大きな利点は、 \texttt{TreeSHAP} のような高速な推定技術が利用できることである。
本稿では,任意のPD関数を効率的に推定する木に基づく新しい推定器である \texttt{FastPD} を提案する。
特徴が相関している場合に矛盾するパス依存型 \texttt{TreeSHAP} とは対照的に, \texttt{FastPD} は所望の人口量を常に推定する。
適度に深い木にとって、 \texttt{FastPD} は観測数において既存の方法の複雑さを2次から線形に改善する。
任意の特徴部分集合に対するPD関数を推定することにより、SHAP、PDプロット、高次相互作用効果などのPDベースの解釈を抽出することができる。
関連論文リスト
- Amortized SHAP values via sparse Fourier function approximation [38.818224762845624]
SHAP値は、解釈可能で説明可能なAIで広く使われている、一般的なローカルな特徴属性手法である。
SHAP値を推定するための2段階の手法を提案する。
我々のアルゴリズムの最初のステップは、多くの実世界の予測器がスペクトルバイアスを持つことを示す最近の結果を活用する。
論文 参考訳(メタデータ) (2024-10-08T19:05:50Z) - Exploring the Performance of Continuous-Time Dynamic Link Prediction Algorithms [14.82820088479196]
ダイナミックリンク予測(DLP)は、進化するネットワークにおける将来のリンクの予測に対処する。
本研究では,このような総合的な評価を行うためのツールをコントリビュートする。
評価時に使用可能な陰性サンプリング手法の網羅的な分類法について述べる。
論文 参考訳(メタデータ) (2024-05-27T14:03:28Z) - Tuning Pre-trained Model via Moment Probing [62.445281364055795]
本稿では,LP の可能性を探るため,新しい Moment Probing (MP) 法を提案する。
MPは、最終特徴の平均に基づいて線形分類ヘッドを実行する。
当社のMPはLPを著しく上回り、トレーニングコストの低い相手と競争しています。
論文 参考訳(メタデータ) (2023-07-21T04:15:02Z) - Efficient Model-Free Exploration in Low-Rank MDPs [76.87340323826945]
低ランクマルコフ決定プロセスは、関数近似を持つRLに対して単純だが表現力のあるフレームワークを提供する。
既存のアルゴリズムは、(1)計算的に抽出可能であるか、または(2)制限的な統計的仮定に依存している。
提案手法は,低ランクMPPの探索のための最初の実証可能なサンプル効率アルゴリズムである。
論文 参考訳(メタデータ) (2023-07-08T15:41:48Z) - Learning Unnormalized Statistical Models via Compositional Optimization [73.30514599338407]
実データと人工雑音のロジスティックな損失として目的を定式化することにより, ノイズコントラスト推定(NCE)を提案する。
本稿では,非正規化モデルの負の対数類似度を最適化するための直接的アプローチについて検討する。
論文 参考訳(メタデータ) (2023-06-13T01:18:16Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - A computationally efficient framework for vector representation of
persistence diagrams [0.0]
本稿では,ベクトル化永続化ブロック(VPB)と呼ばれる$mathbbRn$の永続化ダイアグラム(PD)をベクトルに変換するフレームワークを提案する。
我々の表現は、入力雑音に対する安定性、計算コストの低さ、柔軟性など、ベクトルベースの要約の望ましい多くの特性を持っている。
論文 参考訳(メタデータ) (2021-09-16T22:02:35Z) - Nonparametric estimation of continuous DPPs with kernel methods [0.0]
パラメトリックおよび非パラメトリック推論法は、有限の場合、すなわち、点パターンが有限の基底集合に存在する場合において提案されている。
我々は、この最大可能性(MLE)問題の制限バージョンが、RKHSにおける非負関数に対する最近の表現定理の範囲内にあることを示す。
この有限次元問題を解くための固定点アルゴリズムを提案し,解析し,実証する。
論文 参考訳(メタデータ) (2021-06-27T11:57:14Z) - On Guaranteed Optimal Robust Explanations for NLP Models [16.358394218953833]
我々は,マシーン学習のための推論に基づく説明を構築し,ニューラルネットワークモデルのための局所的説明を計算する方法を開発した。
我々は,それぞれ暗黙の打撃集合と最大普遍部分集合に基づく2つの解アルゴリズムを提案する。
SST、Twitter、IMDBデータセットから、広く使用されている3つの感情分析タスクと最大100ワードのテキストに基づいてフレームワークを評価します。
論文 参考訳(メタデータ) (2021-05-08T08:44:48Z) - Fast Hierarchical Games for Image Explanations [78.16853337149871]
本稿では,シェープリー係数の階層的拡張に基づく画像分類のモデル非依存な説明法を提案する。
他のShapleyベースの説明手法とは異なり、h-Shapはスケーラブルで近似を必要とせずに計算できる。
本手法は,合成データセット,医用画像シナリオ,一般コンピュータビジョン問題において,一般的なシャプリーベースおよび非サプリーベース手法と比較した。
論文 参考訳(メタデータ) (2021-04-13T13:11:02Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。