論文の概要: Absolute Shapley Value
- arxiv url: http://arxiv.org/abs/2003.10076v1
- Date: Mon, 23 Mar 2020 04:26:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 23:51:06.424471
- Title: Absolute Shapley Value
- Title(参考訳): 絶対シャプリー値
- Authors: Jinfei Liu
- Abstract要約: 協調ゲーム理論において、各連立への各貢献者の限界寄与は非負の値である。
機械学習モデルトレーニングでは、各連立に対する各コントリビュータ(データ)の貢献は負の値になる可能性がある。
本稿では,Shapley値の計算において負の限界寄与をどう扱うかという問題について検討する。
- 参考スコア(独自算出の注目度): 2.0711789781518752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shapley value is a concept in cooperative game theory for measuring the
contribution of each participant, which was named in honor of Lloyd Shapley.
Shapley value has been recently applied in data marketplaces for compensation
allocation based on their contribution to the models. Shapley value is the only
value division scheme used for compensation allocation that meets three
desirable criteria: group rationality, fairness, and additivity. In cooperative
game theory, the marginal contribution of each contributor to each coalition is
a nonnegative value. However, in machine learning model training, the marginal
contribution of each contributor (data tuple) to each coalition (a set of data
tuples) can be a negative value, i.e., the accuracy of the model trained by a
dataset with an additional data tuple can be lower than the accuracy of the
model trained by the dataset only.
In this paper, we investigate the problem of how to handle the negative
marginal contribution when computing Shapley value. We explore three
philosophies: 1) taking the original value (Original Shapley Value); 2) taking
the larger of the original value and zero (Zero Shapley Value); and 3) taking
the absolute value of the original value (Absolute Shapley Value). Experiments
on Iris dataset demonstrate that the definition of Absolute Shapley Value
significantly outperforms the other two definitions in terms of evaluating data
importance (the contribution of each data tuple to the trained model).
- Abstract(参考訳): シェープリー値(英: Shapley value)は、ロイド・シェープリーに因んで命名された、各参加者の貢献を測定する協調ゲーム理論における概念である。
shapleyの値は最近、データマーケットプレースにおいて、モデルへの貢献に基づいて報酬の割り当てに適用される。
シャプリー価値は、グループ合理性、公平性、付加性という3つの望ましい基準を満たす補償割当に使用される唯一の価値割当スキームである。
協調ゲーム理論では、各連立に対する各貢献者の限界貢献は非負の値である。
しかしながら、機械学習モデルのトレーニングでは、各結合(データタプルの集合)に対する各貢献者(データタプル)の限界貢献度は負の値となり、つまり、追加のデータタプルを持つデータセットでトレーニングされたモデルの精度は、データセットのみによって訓練されたモデルの精度よりも低くすることができる。
本稿では,Shapley値の計算における負の限界寄与の扱い方について検討する。
3つの哲学を探求します
1) 原価(Original Shapley Value)の取得
2) 元の値の大きい値とゼロ値(シャプリー値ゼロ)を取ること,及び
3)原値の絶対値(絶対シャプリー値)を取る。
Irisデータセットの実験では、絶対共有値の定義は、データの重要性(トレーニングされたモデルへの各データタプルの貢献)を評価するという点で、他の2つの定義よりも大幅に優れています。
関連論文リスト
- Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Shapley Value on Probabilistic Classifiers [6.163093930860032]
機械学習(ML)の文脈では、データ評価手法は、MLモデルの実用性に対する各データポイントの寄与を公平に測定することを目的としている。
従来のShapleyベースのデータ評価手法は、有益と有害なトレーニングデータポイントを効果的に区別するものではない。
確率的効用関数を構成することにより確率的シェープ(P-Shapley)値を提案する。
論文 参考訳(メタデータ) (2023-06-12T15:09:13Z) - Efficient Shapley Values Estimation by Amortization for Text
Classification [66.7725354593271]
我々は,各入力特徴のシェープ値を直接予測し,追加のモデル評価を行なわずに補正モデルを開発する。
2つのテキスト分類データセットの実験結果から、アモルタイズされたモデルでは、Shapley Valuesを最大60倍のスピードアップで正確に見積もっている。
論文 参考訳(メタデータ) (2023-05-31T16:19:13Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - On Generalization in Coreference Resolution [66.05112218880907]
モデルの市販性能を評価するため、異なるドメインを対象とした8つのコア参照解決データセットを統合する。
次に、それらのドメイン、アノテーションガイドライン、メタデータが異なるにもかかわらず、トレーニングのために3つのデータセットを混ぜて、単一のモデルを共同でトレーニングする方法を提案する。
ゼロショット環境では、単一のデータセット転送でトレーニングされたモデルが不十分であるのに対して、共同トレーニングの成果によって全体的なパフォーマンスが改善されていることが分かりました。
論文 参考訳(メタデータ) (2021-09-20T16:33:22Z) - Joint Shapley values: a measure of joint feature importance [6.169364905804678]
結合Shapley値を導入し、Shapley公理を直接拡張する。
ジョイントシェープの値は、モデルの予測に対する特徴の平均的な影響を測る。
ゲームの結果、ジョイントシェープの値は既存の相互作用指標とは異なる洞察を示します。
論文 参考訳(メタデータ) (2021-07-23T17:22:37Z) - The Shapley Value of Classifiers in Ensemble Games [7.23389716633927]
この質問に答えるために、移動可能なユーティリティ協力ゲームの新しいクラスを紹介します。
アンサンブルゲームのプレイヤーは、データセットからポイントを正しくラベル付けするためにアンサンブルで協力する事前訓練されたバイナリ分類器です。
我々は,アンサンブルゲームのShapley値に基づいて,個々のモデルのペイオフを指定するスケーラブルなアルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-01-06T17:40:23Z) - On the Importance of Adaptive Data Collection for Extremely Imbalanced
Pairwise Tasks [94.23884467360521]
我々は、QQPとWikiQAでトレーニングされた最先端技術モデルが、現実的に不均衡なテストデータで評価された場合、それぞれ平均精度が2.4%しか持たないことを示した。
より有益なネガティブな例でバランスのとれたトレーニングデータを作成することで、アクティブラーニングは平均精度をQQPで32.5%、WikiQAで20.1%に大幅に改善する。
論文 参考訳(メタデータ) (2020-10-10T21:56:27Z) - Predictive and Causal Implications of using Shapley Value for Model
Interpretation [6.744385328015561]
我々は、予測モデルと因果モデルの両方において重要な概念である、シェープ価値と条件独立の関係を確立した。
その結果,モデルから高いShapley値を持つ変数を排除しても必ずしも予測性能を損なうとは限らないことが示唆された。
さらに重要なことに、変数のShapley値は、関心の対象との因果関係を反映しない。
論文 参考訳(メタデータ) (2020-08-12T01:08:08Z) - Towards Efficient Data Valuation Based on the Shapley Value [65.4167993220998]
本稿では,Shapley値を用いたデータ評価の問題点について検討する。
Shapleyの値は、データ値の概念に対して多くのデシダータを満たすユニークなペイオフスキームを定義する。
本稿では,Shapley値を近似する効率的なアルゴリズムのレパートリーを提案する。
論文 参考訳(メタデータ) (2019-02-27T00:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。