論文の概要: shapr: Explaining Machine Learning Models with Conditional Shapley Values in R and Python
- arxiv url: http://arxiv.org/abs/2504.01842v1
- Date: Wed, 02 Apr 2025 15:47:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:18:22.404030
- Title: shapr: Explaining Machine Learning Models with Conditional Shapley Values in R and Python
- Title(参考訳): Shapr: RとPythonで条件付き共有値を持つ機械学習モデルを説明する
- Authors: Martin Jullum, Lars Henry Berge Olsen, Jon Lachmann, Annabelle Redelmeier,
- Abstract要約: Shaprは、機械学習と統計的回帰モデルのためにRとPythonの両方でShapley値説明を生成する汎用ツールである。
我々は、Shaprpy Pythonライブラリを導入し、Pythonエコシステムにshaprのコア機能を提供する。
- 参考スコア(独自算出の注目度): 0.6562256987706128
- License:
- Abstract: This paper introduces the shapr package, a versatile tool for generating Shapley value explanations for machine learning and statistical regression models in both R and Python. The package emphasizes conditional Shapley value estimates, providing a comprehensive range of approaches for accurately capturing feature dependencies, which is crucial for correct model interpretation and lacking in similar software. In addition to regular tabular data, the shapr R-package includes specialized functionality for explaining time series forecasts. The package offers a minimal set of user functions with sensible defaults for most use cases while providing extensive flexibility for advanced users to fine-tune computations. Additional features include parallelized computations, iterative estimation with convergence detection, and rich visualization tools. shapr also extends its functionality to compute causal and asymmetric Shapley values when causal information is available. In addition, we introduce the shaprpy Python library, which brings core capabilities of shapr to the Python ecosystem. Overall, the package aims to enhance the interpretability of predictive models within a powerful and user-friendly framework.
- Abstract(参考訳): 本稿では,機械学習と統計的回帰モデルのためのShapley値記述を生成する汎用ツールであるshaprパッケージを紹介する。
このパッケージは条件付きシェープ値の推定を強調し、機能の依存関係を正確に把握するための包括的なアプローチを提供する。
通常の表データに加えて、Shapr Rパッケージには時系列予測を説明する特別な機能が含まれている。
このパッケージは、ほとんどのユースケースで適切なデフォルトを持つ最小限のユーザ関数セットを提供すると同時に、高度なユーザが微調整の計算を行うための広範な柔軟性を提供する。
他にも並列計算、収束検出による反復推定、リッチビジュアライゼーションツールなどが追加されている。
Shaprはまた、因果情報が利用可能なときに、因果値と非対称なShapley値を計算する機能も拡張している。
さらに、Shaprpy Pythonライブラリを導入し、Pythonエコシステムにshaprのコア機能を提供する。
全体として、このパッケージは、強力でユーザフレンドリなフレームワークにおける予測モデルの解釈可能性を高めることを目的としている。
関連論文リスト
- Functional relevance based on the continuous Shapley value [0.0]
この研究は、関数データに基づく予測モデルの解釈可能性に焦点を当てる。
連続ゲームにおけるShapley値に基づく解釈可能性手法を提案する。
この手法は、シミュレーションおよび実データを用いた一連の実験を通して説明される。
論文 参考訳(メタデータ) (2024-11-27T18:20:00Z) - RobPy: a Python Package for Robust Statistical Methods [1.2233362977312945]
RobPyはPythonで幅広い堅牢なメソッドを提供し、NumPy、SciPy、Scikit-learnといった既存のライブラリ上に構築されている。
本稿では、RobPyパッケージの構造を示し、実例を通してその機能を実証し、その機能を他の統計ソフトウェアにおける既存の実装と比較する。
論文 参考訳(メタデータ) (2024-11-04T10:27:30Z) - Improving the Sampling Strategy in KernelSHAP [0.8057006406834466]
KernelSHAPフレームワークは、重み付けされた条件付き期待値のサンプルサブセットを用いて、Shapley値の近似を可能にする。
本稿では,現在最先端戦略における重みの分散を低減するための安定化手法,サンプルサブセットに基づいてShapleyカーネル重みを補正する新しい重み付け方式,および重要なサブセットを包含して修正されたShapleyカーネル重みと統合する簡単な戦略を提案する。
論文 参考訳(メタデータ) (2024-10-07T10:02:31Z) - Highly Adaptive Ridge [84.38107748875144]
直交可積分な部分微分を持つ右連続函数のクラスにおいて,$n-2/3$自由次元L2収束率を達成する回帰法を提案する。
Harは、飽和ゼロオーダーテンソル積スプライン基底展開に基づいて、特定のデータ適応型カーネルで正確にカーネルリッジレグレッションを行う。
我々は、特に小さなデータセットに対する最先端アルゴリズムよりも経験的性能が優れていることを示す。
論文 参考訳(メタデータ) (2024-10-03T17:06:06Z) - Helpful or Harmful Data? Fine-tuning-free Shapley Attribution for Explaining Language Model Predictions [38.87540833773233]
実例スコアの符号にロバスト性の概念を提案する。
本稿では,例えば,Shapley値の高精度な微調整自由近似を導入する。
論文 参考訳(メタデータ) (2024-06-07T03:29:57Z) - Interpreting Deep Neural Networks with the Package innsight [0.951828574518325]
innsightは一般的に、ニューラルネットワークのための機能属性メソッドを実装する最初のRパッケージである。
ディープラーニングライブラリとは独立して動作し、任意のRパッケージからモデルの解釈を可能にする。
Innsightは、トーチパッケージの高速かつ効率的な配列計算から内部的に恩恵を受ける。
論文 参考訳(メタデータ) (2023-06-19T10:12:32Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - Scikit-dimension: a Python package for intrinsic dimension estimation [58.8599521537]
この技術ノートは、固有次元推定のためのオープンソースのPythonパッケージであるtextttscikit-dimensionを紹介している。
textttscikit-dimensionパッケージは、Scikit-learnアプリケーションプログラミングインターフェイスに基づいて、既知のID推定子のほとんどを均一に実装する。
パッケージを簡潔に記述し、実生活と合成データにおけるID推定手法の大規模(500以上のデータセット)ベンチマークでその使用を実証する。
論文 参考訳(メタデータ) (2021-09-06T16:46:38Z) - Particle-Gibbs Sampling For Bayesian Feature Allocation Models [77.57285768500225]
最も広く使われているMCMC戦略は、特徴割り当て行列のギブス更新に頼っている。
単一移動で特徴割り当て行列の全行を更新できるギブスサンプリング器を開発した。
このサンプルは、計算複雑性が特徴数で指数関数的にスケールするにつれて、多数の特徴を持つモデルにとって実用的ではない。
我々は,行ワイズギブズ更新と同じ分布を目標としたパーティクルギブズサンプルの開発を行うが,特徴数でのみ線形に増大する計算複雑性を有する。
論文 参考訳(メタデータ) (2020-01-25T22:11:51Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。