論文の概要: A comparative analysis of machine learning models in SHAP analysis
- arxiv url: http://arxiv.org/abs/2604.07258v1
- Date: Wed, 08 Apr 2026 16:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.631795
- Title: A comparative analysis of machine learning models in SHAP analysis
- Title(参考訳): SHAP解析における機械学習モデルの比較解析
- Authors: Justin Lin, Julia Fukuyama,
- Abstract要約: 大きなブラックボックスモデルは、膨大なデータを処理し、信じられないほど複雑なデータパターンを学習する能力によって、標準になりつつある。
これらの手法の欠如は、予測過程を説明できないことであり、それらが信頼できないものとなり、高い状況で利用できない。
Shapley Additive ExPlanations (SHAP)分析は、オリジナルの特徴の観点からモデル予測を説明する能力で人気が高まっている説明可能なAIメソッドである。
- 参考スコア(独自算出の注目度): 1.3965477771846408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this growing age of data and technology, large black-box models are becoming the norm due to their ability to handle vast amounts of data and learn incredibly complex data patterns. The deficiency of these methods, however, is their inability to explain the prediction process, making them untrustworthy and their use precarious in high-stakes situations. SHapley Additive exPlanations (SHAP) analysis is an explainable AI method growing in popularity for its ability to explain model predictions in terms of the original features. For each sample and feature in the data set, an associated SHAP value quantifies the contribution of that feature to the prediction of that sample. Analysis of these SHAP values provides valuable insight into the model's decision-making process, which can be leveraged to create data-driven solutions. The interpretation of these SHAP values, however, is model-dependent, so there does not exist a universal analysis procedure. To aid in these efforts, we present a detailed investigation of SHAP analysis across various machine learning models and data sets. In uncovering the details and nuance behind SHAP analysis, we hope to empower analysts in this less-explored territory. We also present a novel generalization of the waterfall plot to the multi-classification problem.
- Abstract(参考訳): 膨大な量のデータを処理し、信じられないほど複雑なデータパターンを学習する能力によって、この成長するデータと技術の時代には、大規模なブラックボックスモデルが標準になりつつある。
しかし、これらの手法の欠如は、予測過程を説明できないことであり、それらが信頼できないものとなり、高い状況で利用されてしまう。
SHAP(SHapley Additive exPlanations)分析は、オリジナルの特徴からモデル予測を説明する能力で人気が高まっている、説明可能なAIメソッドである。
データセットの各サンプルと特徴について、関連するSHAP値は、そのサンプルの予測に対するその機能の貢献を定量化します。
これらのSHAP値の分析は、データ駆動ソリューションの作成に活用可能な、モデルの意思決定プロセスに関する貴重な洞察を提供する。
しかし、これらのSHAP値の解釈はモデルに依存しているため、普遍的な解析手順は存在しない。
これらの取り組みを支援するため,各種機械学習モデルとデータセット間のSHAP解析について詳細に検討する。
SHAP分析の背景にある詳細とニュアンスを明らかにすることで、この未調査領域のアナリストに力を与えたいと思っています。
また,マルチクラス化問題に対して,ウォーターフォールプロットの新たな一般化を提案する。
関連論文リスト
- SHAPCA: Consistent and Interpretable Explanations for Machine Learning Models on Spectroscopy Data [3.6869511677142373]
分光データの高次元性と強いコリニアリティは、説明可能性のモデル化に根本的な課題を生んでいる。
本研究は,主成分分析(次元化のための)と形状付加的展開(ポストホック説明のための)を組み合わせた説明可能な機械学習パイプラインであるSHAPCAを提案する。
提案したフレームワークは、グローバルとローカルの両方の観点からの分析を可能にし、モデル全体の振る舞いを駆動するスペクトル帯域を明らかにする。
論文 参考訳(メタデータ) (2026-03-19T16:58:31Z) - Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation [192.53529928861818]
高リソースデータによる学習は人工知能(AI)において大きな成功を収めた
しかし、データアノテーションやモデルトレーニングに関連するコストは依然として大きい。
本調査では,低リソースデータからの学習に伴う一般化誤差とラベル複雑性を分析するために,アクティブサンプリング理論を用いた。
論文 参考訳(メタデータ) (2025-10-10T03:15:42Z) - SHAP-Based Supervised Clustering for Sample Classification and the Generalized Waterfall Plot [1.3965477771846408]
膨大な量のデータを処理し、信じられないほど複雑な入出力関係を学習する能力によって、大規模なブラックボックスモデルが標準になりつつある。
これらの手法の欠如は、予測過程を説明できないことであり、それらが信頼できないものとなり、高い状況で利用できない。
Shapley Additive ExPlanations (SHAP)分析は、オリジナルの特徴の観点からモデル予測を説明する能力で人気が高まっている説明可能なAIメソッドである。
論文 参考訳(メタデータ) (2025-10-09T18:45:43Z) - A Method for Evaluating the Interpretability of Machine Learning Models in Predicting Bond Default Risk Based on LIME and SHAP [7.7133862848321835]
本稿では,AIモデルによく使用される機械学習アルゴリズムを適用し,債券市場のデフォルト予測をケーススタディとして用いた。
この分析結果は、これらのモデルの解釈可能性に関する直感的な理解と論理的期待と一致している。
論文 参考訳(メタデータ) (2025-02-26T23:05:34Z) - A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。
モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。
一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文 参考訳(メタデータ) (2025-02-26T06:18:13Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - rTisane: Externalizing conceptual models for data analysis increases
engagement with domain knowledge and improves statistical model quality [11.156807472212165]
統計モデルは、変数とその関係に関するアナリストのドメイン知識を正確に反映すべきである。
最近のツールにより、アナリストはこれらの仮定を表現し、結果の統計モデルを作成することができる。
アナリストが何を表現したいのか、外部化が統計モデルの品質に与える影響は、まだ不明だ。
論文 参考訳(メタデータ) (2023-10-25T00:32:52Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Shapley variable importance clouds for interpretable machine learning [2.830197032154301]
本報告では,最終モデルのSHAP解析におけるバイアス評価を回避するため,優れたモデルにまたがる情報をプールするShapley変数重要クラウドを提案する。
刑事司法データと電子カルテデータを用いたドン・アンド・ルーディン法とを比較検討した。
論文 参考訳(メタデータ) (2021-10-06T03:41:04Z) - Beyond Trivial Counterfactual Explanations with Diverse Valuable
Explanations [64.85696493596821]
コンピュータビジョンの応用において、生成的対実法はモデルの入力を摂動させて予測を変更する方法を示す。
本稿では,多様性強化損失を用いて制約される不連続潜在空間における摂動を学習する反事実法を提案する。
このモデルは, 従来の最先端手法と比較して, 高品質な説明を生産する成功率を向上させる。
論文 参考訳(メタデータ) (2021-03-18T12:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。