論文の概要: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''
- arxiv url: http://arxiv.org/abs/2302.11431v1
- Date: Wed, 22 Feb 2023 15:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 14:44:32.063128
- Title: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''
- Title(参考訳): シャプリー値に基づく効率的なデータ評価」についての一考察
- Authors: Jiachen T. Wang, Ruoxi Jia
- Abstract要約: Shapley値(SV)は、データバリュエーションの有望な方法として登場した。
グループテストに基づくSV推定器は、良好なサンプル複雑性を実現する。
- 参考スコア(独自算出の注目度): 7.4011772612133475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Shapley value (SV) has emerged as a promising method for data valuation.
However, computing or estimating the SV is often computationally expensive. To
overcome this challenge, Jia et al. (2019) propose an advanced SV estimation
algorithm called ``Group Testing-based SV estimator'' which achieves favorable
asymptotic sample complexity. In this technical note, we present several
improvements in the analysis and design choices of this SV estimator. Moreover,
we point out that the Group Testing-based SV estimator does not fully reuse the
collected samples. Our analysis and insights contribute to a better
understanding of the challenges in developing efficient SV estimation
algorithms for data valuation.
- Abstract(参考訳): Shapley値(SV)はデータバリュエーションの有望な方法として登場した。
しかし、svの計算や推定はしばしば計算コストがかかる。
この課題を克服するため、Jia et al. (2019) は '‘Group Testing-based SV estimator'' と呼ばれる高度なSV推定アルゴリズムを提案し、このアルゴリズムは漸近的なサンプルの複雑さを良好に達成した。
本稿では,このSV推定器の分析と設計におけるいくつかの改良点について述べる。
さらに,グループテストに基づくSV推定器は,収集したサンプルを完全に再利用していないことを指摘した。
我々の分析と洞察は、データ評価のための効率的なSV推定アルゴリズムを開発する上での課題の理解に寄与する。
関連論文リスト
- Mitigating Data Imbalance for Software Vulnerability Assessment: Does Data Augmentation Help? [0.0]
CVSS(Common Vulnerability Scoring System)タスクにおけるモデルの予測性能は,データ不均衡の軽減によって著しく向上することを示す。
また、ランダムなテキスト挿入、削除、置換といった単純なテキスト拡張は、ボード全体のベースラインよりも優れていることもわかりました。
論文 参考訳(メタデータ) (2024-07-15T13:47:55Z) - Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。
既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.646508094051768]
我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。
Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。
本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文 参考訳(メタデータ) (2023-06-03T10:22:50Z) - Probably Approximate Shapley Fairness with Applications in Machine
Learning [18.05783128571293]
Shapley値(SV)は機械学習(ML)のさまざまなシナリオで採用されている。
正確なSVは実際に計算できないので、SV推定は代わりに近似される。
この近似ステップは重要な疑問を提起する: SV推定は正確なSVの公平性を保証するか?
正確なSVの公平性保証は、SV推定に制限的すぎることが観察される。
論文 参考訳(メタデータ) (2022-12-01T16:28:20Z) - Design Guidelines for Inclusive Speaker Verification Evaluation Datasets [0.6015898117103067]
話者検証(SV)は、アクセス制御を備えた数十億の音声対応デバイスを提供し、音声駆動技術のセキュリティを保証する。
現在のSV評価プラクティスは偏見を評価するには不十分であり、実際の使用シナリオを代表してではなく、過度に単純化され、ユーザを集約している。
本稿では,これらの欠点に対処するSV評価データセットを構築するための設計ガイドラインを提案する。
論文 参考訳(メタデータ) (2022-04-05T15:28:26Z) - Pessimistic Q-Learning for Offline Reinforcement Learning: Towards
Optimal Sample Complexity [51.476337785345436]
有限水平マルコフ決定過程の文脈におけるQ-ラーニングの悲観的変種について検討する。
ほぼ最適サンプル複雑性を実現するために,分散再現型悲観的Q-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T15:39:36Z) - Active Surrogate Estimators: An Active Learning Approach to
Label-Efficient Model Evaluation [59.7305309038676]
モデル評価のためのアクティブサロゲート推定器(ASE)を提案する。
ASEは現在の最先端技術よりもラベル効率が高いことが分かりました。
論文 参考訳(メタデータ) (2022-02-14T17:15:18Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - A Survey on Data-driven Software Vulnerability Assessment and
Prioritization [0.0]
ソフトウェア脆弱性(SV)は複雑さと規模が増加しており、多くのソフトウェアシステムに重大なセキュリティリスクを生じさせている。
機械学習やディープラーニングといったデータ駆動技術は、SVの評価と優先順位付けを次のレベルに引き上げた。
論文 参考訳(メタデータ) (2021-07-18T04:49:22Z) - A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。
モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。
DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文 参考訳(メタデータ) (2020-04-20T13:26:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。