論文の概要: Antithetic Sampling for Top-k Shapley Identification
- arxiv url: http://arxiv.org/abs/2504.02019v1
- Date: Wed, 02 Apr 2025 15:38:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:57:25.333691
- Title: Antithetic Sampling for Top-k Shapley Identification
- Title(参考訳): トップkシェープ同定のためのアンチセプティックサンプリング
- Authors: Patrick Kolpaczki, Tim Nielen, Eyke Hüllermeier,
- Abstract要約: 説明可能なAIの内外におけるShapleyの価値は、その公理的な特異性に起因している。
ほとんどの研究は、すべての特徴のShapley値の均一な近似を調査し、無意味な特徴のサンプルを不必要に消費する。
対照的に、$k$の最も重要な特徴を特定することは、既に十分に洞察に富むものであり、多武装の盗賊の分野と結びついたアルゴリズム的機会を活用する可能性をもたらす。
- 参考スコア(独自算出の注目度): 19.221081896134567
- License:
- Abstract: Additive feature explanations rely primarily on game-theoretic notions such as the Shapley value by viewing features as cooperating players. The Shapley value's popularity in and outside of explainable AI stems from its axiomatic uniqueness. However, its computational complexity severely limits practicability. Most works investigate the uniform approximation of all features' Shapley values, needlessly consuming samples for insignificant features. In contrast, identifying the $k$ most important features can already be sufficiently insightful and yields the potential to leverage algorithmic opportunities connected to the field of multi-armed bandits. We propose Comparable Marginal Contributions Sampling (CMCS), a method for the top-$k$ identification problem utilizing a new sampling scheme taking advantage of correlated observations. We conduct experiments to showcase the efficacy of our method in compared to competitive baselines. Our empirical findings reveal that estimation quality for the approximate-all problem does not necessarily transfer to top-$k$ identification and vice versa.
- Abstract(参考訳): 付加的な特徴説明は主に、特徴を協調プレイヤーとして見ることでShapley値のようなゲーム理論的な概念に依存している。
説明可能なAIの内外におけるShapleyの価値は、その公理的な特異性に起因している。
しかし、その計算複雑性は実行可能性を大幅に制限する。
ほとんどの研究は、すべての特徴のシェープ値の均一な近似を調査し、無意味な特徴のサンプルを不必要に消費する。
対照的に、$k$の最も重要な特徴を特定することは、既に十分に洞察に富むものであり、多武装の盗賊の分野と結びついたアルゴリズム的機会を活用する可能性をもたらす。
相関観測を生かした新しいサンプリング手法を用いて,トップ$kの識別問題の手法であるComparable Marginal Contributions Smpling (CMCS)を提案する。
我々は,本手法の有効性を,競争基準に比べて実証する実験を行った。
実験結果から, ほぼすべての問題に対する推定精度は, 必ずしも上位k$の識別に移行せず, その逆も可能であることがわかった。
関連論文リスト
- Shapley Value Approximation Based on k-Additive Games [21.023521613326654]
シェープリー値(Shapley value)は、支払いを複数のエージェントに分けなければならない公平な分割問題に対する一般的な解である。
その人気と公理的な正当化にもかかわらず、Shapleyの値は、関係するエンティティの数と指数関数的にスケールする計算複雑性に悩まされている。
我々は、$k$-additive surrogateゲームに適合する新しい近似法であるSVA$k_textADD$を提案する。
論文 参考訳(メタデータ) (2025-02-07T08:52:57Z) - Statistical Significance of Feature Importance Rankings [3.8642937395065124]
高確率保証で最も重要な機能が正しいことを確実にするテクニックを考案する。
これらは、上位機能のセットと要素の順序をK$で評価する。
次に、2つの効率的なサンプリングアルゴリズムを導入し、おそらくは1-alpha$を超える確率で、K$の最も重要な特徴を識別する。
論文 参考訳(メタデータ) (2024-01-28T23:14:51Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.646508094051768]
我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。
Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。
本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文 参考訳(メタデータ) (2023-06-03T10:22:50Z) - Approximating the Shapley Value without Marginal Contributions [11.539320505465149]
協調ゲームにおいてプレイヤーに有意義な貢献価値を割り当てる最も一般的な手法であるShapley値は最近、説明可能な人工知能において集中的に使用されている。
本稿では,余剰寄与の概念から分離されたShapley値の表現に基づく2つのパラメータフリーおよびドメイン非依存近似アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-01T20:14:22Z) - Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。
$nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文 参考訳(メタデータ) (2022-12-26T15:13:13Z) - SHAP-XRT: The Shapley Value Meets Conditional Independence Testing [21.794110108580746]
そこで本研究では,Shapleyに基づく説明手法と条件付き独立性テストが密接に関連していることを示す。
本研究では,条件付きランダム化テスト(CRT, Conditional Randomization Test)にインスパイアされたテスト手法であるSHAPley Explanation Randomization Test(SHAP-XRT)を紹介した。
我々は、Shapley値自体が大域(つまり全体)のnull仮説の期待$p$-値に上限を与えることを示した。
論文 参考訳(メタデータ) (2022-07-14T16:28:54Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - The Price of Incentivizing Exploration: A Characterization via Thompson
Sampling and Sample Complexity [83.81297078039836]
インセンティブ付き探索(Incentivized Exploring)は、武器の選択を自給自足エージェントによって制御するマルチアーム・バンディットのバージョンである。
我々は、インセンティブの価格に焦点を合わせ、インセンティブの適合性のために、広く解釈された、パフォーマンスの喪失が引き起こされる。
論文 参考訳(メタデータ) (2020-02-03T04:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。