論文の概要: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''
- arxiv url: http://arxiv.org/abs/2302.11431v1
- Date: Wed, 22 Feb 2023 15:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 14:44:32.063128
- Title: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''
- Title(参考訳): シャプリー値に基づく効率的なデータ評価」についての一考察
- Authors: Jiachen T. Wang, Ruoxi Jia
- Abstract要約: Shapley値(SV)は、データバリュエーションの有望な方法として登場した。
グループテストに基づくSV推定器は、良好なサンプル複雑性を実現する。
- 参考スコア(独自算出の注目度): 7.4011772612133475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Shapley value (SV) has emerged as a promising method for data valuation.
However, computing or estimating the SV is often computationally expensive. To
overcome this challenge, Jia et al. (2019) propose an advanced SV estimation
algorithm called ``Group Testing-based SV estimator'' which achieves favorable
asymptotic sample complexity. In this technical note, we present several
improvements in the analysis and design choices of this SV estimator. Moreover,
we point out that the Group Testing-based SV estimator does not fully reuse the
collected samples. Our analysis and insights contribute to a better
understanding of the challenges in developing efficient SV estimation
algorithms for data valuation.
- Abstract(参考訳): Shapley値(SV)はデータバリュエーションの有望な方法として登場した。
しかし、svの計算や推定はしばしば計算コストがかかる。
この課題を克服するため、Jia et al. (2019) は '‘Group Testing-based SV estimator'' と呼ばれる高度なSV推定アルゴリズムを提案し、このアルゴリズムは漸近的なサンプルの複雑さを良好に達成した。
本稿では,このSV推定器の分析と設計におけるいくつかの改良点について述べる。
さらに,グループテストに基づくSV推定器は,収集したサンプルを完全に再利用していないことを指摘した。
我々の分析と洞察は、データ評価のための効率的なSV推定アルゴリズムを開発する上での課題の理解に寄与する。
関連論文リスト
- Exploring Unified Perspective For Fast Shapley Value Estimation [77.15924044466976]
共有値の単純かつ効率的な推定法であるSimSHAPを提案する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Probably Approximate Shapley Fairness with Applications in Machine
Learning [18.05783128571293]
Shapley値(SV)は機械学習(ML)のさまざまなシナリオで採用されている。
正確なSVは実際に計算できないので、SV推定は代わりに近似される。
この近似ステップは重要な疑問を提起する: SV推定は正確なSVの公平性を保証するか?
正確なSVの公平性保証は、SV推定に制限的すぎることが観察される。
論文 参考訳(メタデータ) (2022-12-01T16:28:20Z) - Variance reduced Shapley value estimation for trustworthy data valuation [16.03510965397185]
階層化サンプリングを用いたよりロバストなデータ評価手法を提案する。
理論的には、層状化の方法、各層でどれだけのサンプルを採取するか、そしてVRDSの複雑さ分析の例を示す。
論文 参考訳(メタデータ) (2022-10-30T13:04:52Z) - Design Guidelines for Inclusive Speaker Verification Evaluation Datasets [0.6015898117103067]
話者検証(SV)は、アクセス制御を備えた数十億の音声対応デバイスを提供し、音声駆動技術のセキュリティを保証する。
現在のSV評価プラクティスは偏見を評価するには不十分であり、実際の使用シナリオを代表してではなく、過度に単純化され、ユーザを集約している。
本稿では,これらの欠点に対処するSV評価データセットを構築するための設計ガイドラインを提案する。
論文 参考訳(メタデータ) (2022-04-05T15:28:26Z) - Pessimistic Q-Learning for Offline Reinforcement Learning: Towards
Optimal Sample Complexity [51.476337785345436]
有限水平マルコフ決定過程の文脈におけるQ-ラーニングの悲観的変種について検討する。
ほぼ最適サンプル複雑性を実現するために,分散再現型悲観的Q-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T15:39:36Z) - Active Surrogate Estimators: An Active Learning Approach to
Label-Efficient Model Evaluation [59.7305309038676]
モデル評価のためのアクティブサロゲート推定器(ASE)を提案する。
ASEは現在の最先端技術よりもラベル効率が高いことが分かりました。
論文 参考訳(メタデータ) (2022-02-14T17:15:18Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - A Survey on Data-driven Software Vulnerability Assessment and
Prioritization [0.0]
ソフトウェア脆弱性(SV)は複雑さと規模が増加しており、多くのソフトウェアシステムに重大なセキュリティリスクを生じさせている。
機械学習やディープラーニングといったデータ駆動技術は、SVの評価と優先順位付けを次のレベルに引き上げた。
論文 参考訳(メタデータ) (2021-07-18T04:49:22Z) - The Shapley Value of coalition of variables provides better explanations [0.0]
SV(Shapley Values)がいまだに理解されていないことを示す。
ダミー変数のSVを和らげるという一般的な実践は誤りであることを示す。
重要な変数の正しい計算と推論を提供します。
論文 参考訳(メタデータ) (2021-03-24T17:02:57Z) - A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。
モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。
DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文 参考訳(メタデータ) (2020-04-20T13:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。