論文の概要: FW-Shapley: Real-time Estimation of Weighted Shapley Values
- arxiv url: http://arxiv.org/abs/2503.06602v1
- Date: Sun, 09 Mar 2025 13:13:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:46:48.947858
- Title: FW-Shapley: Real-time Estimation of Weighted Shapley Values
- Title(参考訳): FW-Shapley:重み付きShapley値のリアルタイム推定
- Authors: Pranoy Panda, Siddharth Tandon, Vineeth N Balasubramanian,
- Abstract要約: 我々は、重み付きシェープリー値を効率的に計算するアモータイズされたフレームワークであるFast Weighted Shapleyを提案する。
また,本実験では,基礎的真理重み付きシェープリー値を使用しなくても,理論的に有効であることを示す。
データバリュエーションに関しては、最先端のKNN Shapleyに匹敵するものながら、はるかに高速(14倍)です。
- 参考スコア(独自算出の注目度): 21.562508939780532
- License:
- Abstract: Fair credit assignment is essential in various machine learning (ML) applications, and Shapley values have emerged as a valuable tool for this purpose. However, in critical ML applications such as data valuation and feature attribution, the uniform weighting of Shapley values across subset cardinalities leads to unintuitive credit assignments. To address this, weighted Shapley values were proposed as a generalization, allowing different weights for subsets with different cardinalities. Despite their advantages, similar to Shapley values, Weighted Shapley values suffer from exponential compute costs, making them impractical for high-dimensional datasets. To tackle this issue, we present two key contributions. Firstly, we provide a weighted least squares characterization of weighted Shapley values. Next, using this characterization, we propose Fast Weighted Shapley (FW-Shapley), an amortized framework for efficiently computing weighted Shapley values using a learned estimator. We further show that our estimator's training procedure is theoretically valid even though we do not use ground truth Weighted Shapley values during training. On the feature attribution task, we outperform the learned estimator FastSHAP by $27\%$ (on average) in terms of Inclusion AUC. For data valuation, we are much faster (14 times) while being comparable to the state-of-the-art KNN Shapley.
- Abstract(参考訳): さまざまな機械学習(ML)アプリケーションにおいて、公平なクレジット割り当てが不可欠であり、Shapleyの値は、この目的のために価値のあるツールとして現れています。
しかし、データアセスメントや特徴属性といった重要なMLアプリケーションでは、サブセットのサブセット間でシャプリー値の均一な重み付けは、直感的な信用代入につながる。
これを解決するために、重み付きシャプリー値が一般化として提案され、異なる濃度を持つ部分集合に対する異なる重み付けが可能である。
Shapleyの値と同様、その利点にもかかわらず、Weighted Shapleyの値は指数計算コストに悩まされ、高次元データセットでは実用的ではない。
この問題に対処するために,2つの重要なコントリビューションを提示します。
まず、重み付けされたシェープリー値の最小二乗特徴づけを与える。
次に,この特徴量を用いて,学習した推定器を用いて重み付きシェープ値の効率的な計算を行うための補正フレームワークであるFW-Shapleyを提案する。
さらに,本研究では,トレーニング中に重み付けシェープ値を使用しなくても,推定者のトレーニング手順が理論的に有効であることを示す。
特徴帰属タスクでは、学習した推定器FastSHAPをインクルージョンAUCで27\%(平均)で上回ります。
データバリュエーションに関しては、最先端のKNN Shapleyに匹敵するものながら、はるかに高速(14倍)です。
関連論文リスト
- Improving the Sampling Strategy in KernelSHAP [0.8057006406834466]
KernelSHAPフレームワークは、重み付けされた条件付き期待値のサンプルサブセットを用いて、Shapley値の近似を可能にする。
本稿では,現在最先端戦略における重みの分散を低減するための安定化手法,サンプルサブセットに基づいてShapleyカーネル重みを補正する新しい重み付け方式,および重要なサブセットを包含して修正されたShapleyカーネル重みと統合する簡単な戦略を提案する。
論文 参考訳(メタデータ) (2024-10-07T10:02:31Z) - Efficient Data Shapley for Weighted Nearest Neighbor Algorithms [47.62605581521535]
WKNN-Shapleyは、重み付き$K$近辺アルゴリズム(WKNN-Shapley)のためのデータ共有の効率的な計算法である
我々は、WKNN-Shapleyの計算効率と、データ品質を非重み付きと比較した場合の優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-20T03:34:18Z) - Accelerated Shapley Value Approximation for Data Evaluation [3.707457963532597]
機械学習問題の構造的特性を活用することにより,データポイントのシェープ値をより効率的に近似できることを示す。
我々の分析は、データバリュエーションの文脈において、小さなサブセットで訓練されたモデルはより重要であることを示唆している。
論文 参考訳(メタデータ) (2023-11-09T13:15:36Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - WeightedSHAP: analyzing and improving Shapley based feature attributions [17.340091573913316]
共有価値(Shapley value)は、個々の特徴の影響を測定するための一般的なアプローチである。
WeightedSHAPを提案する。これはShapleyの価値を一般化し、データから直接フォーカスする限界貢献を学習する。
いくつかの実世界のデータセットにおいて、WeightedSHAPによって識別される影響のある特徴がモデルの予測を再カプセル化できることを示す。
論文 参考訳(メタデータ) (2022-09-27T14:34:07Z) - Shapley-NAS: Discovering Operation Contribution for Neural Architecture
Search [96.20505710087392]
ニューラルアーキテクチャ探索のための演算寄与度(Shapley-NAS)を評価するためのShapley値に基づく手法を提案する。
提案手法は,光探索コストに比例して最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-20T14:41:49Z) - Fast Hierarchical Games for Image Explanations [78.16853337149871]
本稿では,シェープリー係数の階層的拡張に基づく画像分類のモデル非依存な説明法を提案する。
他のShapleyベースの説明手法とは異なり、h-Shapはスケーラブルで近似を必要とせずに計算できる。
本手法は,合成データセット,医用画像シナリオ,一般コンピュータビジョン問題において,一般的なシャプリーベースおよび非サプリーベース手法と比較した。
論文 参考訳(メタデータ) (2021-04-13T13:11:02Z) - Multicollinearity Correction and Combined Feature Effect in Shapley
Values [0.0]
共有値(Shapley value)は、特定の行に対する機能の重要性を表す。
我々は,Shapley値と相関した特徴量を計算する統一的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T12:28:42Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。