論文の概要: An Odd Estimator for Shapley Values
- arxiv url: http://arxiv.org/abs/2602.01399v1
- Date: Sun, 01 Feb 2026 19:07:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.76791
- Title: An Odd Estimator for Shapley Values
- Title(参考訳): 共有値のオッド推定器
- Authors: Fabian Fumagalli, Landon Butler, Justin Singh Kang, Kannan Ramchandran, R. Teal Witter,
- Abstract要約: Shapley値は、特徴の重要性、データバリュエーション、因果推論を含む、機械学習の帰属のためのフレームワークである。
我々は、Shapley値が集合関数の奇数成分にのみ依存していることを証明する。
奇数部分空間のみに回帰を行う一貫した推定器であるOddSHAPを提案する。
- 参考スコア(独自算出の注目度): 19.262788739385012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Shapley value is a ubiquitous framework for attribution in machine learning, encompassing feature importance, data valuation, and causal inference. However, its exact computation is generally intractable, necessitating efficient approximation methods. While the most effective and popular estimators leverage the paired sampling heuristic to reduce estimation error, the theoretical mechanism driving this improvement has remained opaque. In this work, we provide an elegant and fundamental justification for paired sampling: we prove that the Shapley value depends exclusively on the odd component of the set function, and that paired sampling orthogonalizes the regression objective to filter out the irrelevant even component. Leveraging this insight, we propose OddSHAP, a novel consistent estimator that performs polynomial regression solely on the odd subspace. By utilizing the Fourier basis to isolate this subspace and employing a proxy model to identify high-impact interactions, OddSHAP overcomes the combinatorial explosion of higher-order approximations. Through an extensive benchmark evaluation, we find that OddSHAP achieves state-of-the-art estimation accuracy.
- Abstract(参考訳): Shapleyの値は、機械学習における帰属のためのユビキタスなフレームワークであり、特徴の重要性、データバリュエーション、因果推論を含んでいる。
しかし、その正確な計算は一般に難解であり、効率的な近似法を必要とする。
最も効果的で一般的な推定器は、推定誤差を減らすためにペアサンプリングヒューリスティックを利用するが、この改善を導く理論的メカニズムはいまだ不透明である。
この研究では、ペアサンプリングのエレガントで基本的な正当性を提供し、シャプリー値が集合関数の奇数成分にのみ依存していること、およびペアサンプリングが回帰目的を直交させ、無関係な偶数成分をフィルタリングすることを証明する。
この知見を生かして、奇数部分空間のみに多項式回帰を行う新しい一貫した推定器であるOddSHAPを提案する。
フーリエ基底を利用してこの部分空間を分離し、プロキシモデルを用いて高インパクト相互作用を識別することにより、OddSHAPは高次近似の組合せ爆発を克服する。
評価の結果,OddSHAPは最先端の精度で評価できることがわかった。
関連論文リスト
- Unveil Sources of Uncertainty: Feature Contribution to Conformal Prediction Intervals [0.3495246564946556]
共形予測(CP)に基づく新しいモデルに依存しない不確実性属性(UA)法を提案する。
我々は,CP間隔特性-幅や境界条件-を値関数として定義し,入力特徴に対する予測不確かさを属性とする協調ゲームを定義する。
人工ベンチマークと実世界のデータセットを用いた実験は、我々のアプローチの実用的有用性と解釈的深さを実証する。
論文 参考訳(メタデータ) (2025-05-19T13:49:05Z) - Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Energy-Based Model for Accurate Estimation of Shapley Values in Feature Attribution [8.957856106096417]
EmSHAP (Energy-based model for Shapley value Estimation) は、Shapleyコントリビューション関数の期待値を推定するために提案される。
GRU(Gated Recurrent Unit)結合分割関数推定法を提案する。
論文 参考訳(メタデータ) (2024-04-01T12:19:33Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.646508094051768]
我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。
Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。
本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文 参考訳(メタデータ) (2023-06-03T10:22:50Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Improving KernelSHAP: Practical Shapley Value Estimation via Linear
Regression [9.89901717499058]
このアプローチの理解と改善のために,線形回帰によるShapley値を推定する考え方を再考する。
我々は,その収束を検知し,不確実性推定を計算する手法を開発した。
我々は,2つの大域的説明法のための高速な新しい推定器を生成する協調ゲームのためのKernelSHAPのバージョンを開発した。
論文 参考訳(メタデータ) (2020-12-02T21:20:47Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。