Fugu-MT 論文翻訳(概要): A Note on "Towards Efficient Data Valuation Based on the Shapley Value''

論文の概要: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''

arxiv url: http://arxiv.org/abs/2302.11431v1
Date: Wed, 22 Feb 2023 15:13:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-23 14:44:32.063128
Title: A Note on "Towards Efficient Data Valuation Based on the Shapley Value''
Title（参考訳）: シャプリー値に基づく効率的なデータ評価」についての一考察
Authors: Jiachen T. Wang, Ruoxi Jia
Abstract要約: Shapley値(SV)は、データバリュエーションの有望な方法として登場した。グループテストに基づくSV推定器は、良好なサンプル複雑性を実現する。
参考スコア（独自算出の注目度）: 7.4011772612133475
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The Shapley value (SV) has emerged as a promising method for data valuation. However, computing or estimating the SV is often computationally expensive. To overcome this challenge, Jia et al. (2019) propose an advanced SV estimation algorithm called ``Group Testing-based SV estimator'' which achieves favorable asymptotic sample complexity. In this technical note, we present several improvements in the analysis and design choices of this SV estimator. Moreover, we point out that the Group Testing-based SV estimator does not fully reuse the collected samples. Our analysis and insights contribute to a better understanding of the challenges in developing efficient SV estimation algorithms for data valuation.
Abstract（参考訳）: Shapley値(SV)はデータバリュエーションの有望な方法として登場した。しかし、svの計算や推定はしばしば計算コストがかかる。この課題を克服するため、Jia et al. (2019) は '‘Group Testing-based SV estimator'' と呼ばれる高度なSV推定アルゴリズムを提案し、このアルゴリズムは漸近的なサンプルの複雑さを良好に達成した。本稿では,このSV推定器の分析と設計におけるいくつかの改良点について述べる。さらに,グループテストに基づくSV推定器は,収集したサンプルを完全に再利用していないことを指摘した。我々の分析と洞察は、データ評価のための効率的なSV推定アルゴリズムを開発する上での課題の理解に寄与する。

関連論文リスト

Log-Sum-Exponential Estimator for Off-Policy Evaluation and Learning [50.93804891554481]
従来の逆確率スコア推定よりも優れた対数推定演算子(log-sum-exponential (LSE)演算子)に基づく新しい推定器を提案する。我々のLSE推定器は, 重み付き条件下での分散低減とロバスト性を示す。政治以外の学習シナリオでは、LSE推定器と最適ポリシーの間のパフォーマンスギャップである後悔の限界を確立します。
論文参考訳（メタデータ） (2025-06-07T17:37:10Z)
EvalSVA: Multi-Agent Evaluators for Next-Gen Software Vulnerability Assessment [17.74561647070259]
ソフトウェア脆弱性(SV)評価のさまざまな側面を自律的に検討し,評価するために,マルチエージェント評価チームであるEvalSVAを紹介した。 EvalSVAは人間のようなプロセスを提供し、SVアセスメントの理由と答えの両方を生成する。
論文参考訳（メタデータ） (2024-12-11T08:00:50Z)
Mitigating Data Imbalance for Software Vulnerability Assessment: Does Data Augmentation Help? [0.0]
CVSS(Common Vulnerability Scoring System)タスクにおけるモデルの予測性能は,データ不均衡の軽減によって著しく向上することを示す。また、ランダムなテキスト挿入、削除、置換といった単純なテキスト拡張は、ボード全体のベースラインよりも優れていることもわかりました。
論文参考訳（メタデータ） (2024-07-15T13:47:55Z)
Fast Shapley Value Estimation: A Unified Approach [71.92014859992263]
冗長な手法を排除し、単純で効率的なシェープリー推定器SimSHAPを提案する。既存手法の解析において、推定器は特徴部分集合からランダムに要約された値の線形変換として統一可能であることを観察する。実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文参考訳（メタデータ） (2023-11-02T06:09:24Z)
DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.646508094051768]
我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。 Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文参考訳（メタデータ） (2023-06-03T10:22:50Z)
Probably Approximate Shapley Fairness with Applications in Machine Learning [18.05783128571293]
Shapley値(SV)は機械学習(ML)のさまざまなシナリオで採用されている。正確なSVは実際に計算できないので、SV推定は代わりに近似される。この近似ステップは重要な疑問を提起する: SV推定は正確なSVの公平性を保証するか? 正確なSVの公平性保証は、SV推定に制限的すぎることが観察される。
論文参考訳（メタデータ） (2022-12-01T16:28:20Z)
Design Guidelines for Inclusive Speaker Verification Evaluation Datasets [0.6015898117103067]
話者検証(SV)は、アクセス制御を備えた数十億の音声対応デバイスを提供し、音声駆動技術のセキュリティを保証する。現在のSV評価プラクティスは偏見を評価するには不十分であり、実際の使用シナリオを代表してではなく、過度に単純化され、ユーザを集約している。本稿では,これらの欠点に対処するSV評価データセットを構築するための設計ガイドラインを提案する。
論文参考訳（メタデータ） (2022-04-05T15:28:26Z)
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity [51.476337785345436]
有限水平マルコフ決定過程の文脈におけるQ-ラーニングの悲観的変種について検討する。ほぼ最適サンプル複雑性を実現するために,分散再現型悲観的Q-ラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-02-28T15:39:36Z)
Active Surrogate Estimators: An Active Learning Approach to Label-Efficient Model Evaluation [59.7305309038676]
モデル評価のためのアクティブサロゲート推定器(ASE)を提案する。 ASEは現在の最先端技術よりもラベル効率が高いことが分かりました。
論文参考訳（メタデータ） (2022-02-14T17:15:18Z)
Learning to be a Statistician: Learned Estimator for Number of Distinct Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文参考訳（メタデータ） (2022-02-06T15:42:04Z)
Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文参考訳（メタデータ） (2021-08-25T21:30:27Z)
A Survey on Data-driven Software Vulnerability Assessment and Prioritization [0.0]
ソフトウェア脆弱性(SV)は複雑さと規模が増加しており、多くのソフトウェアシステムに重大なセキュリティリスクを生じさせている。機械学習やディープラーニングといったデータ駆動技術は、SVの評価と優先順位付けを次のレベルに引き上げた。
論文参考訳（メタデータ） (2021-07-18T04:49:22Z)
A Revised Generative Evaluation of Visual Dialogue [80.17353102854405]
本稿では,VisDialデータセットの改訂評価手法を提案する。モデルが生成した回答と関連する回答の集合のコンセンサスを測定する。 DenseVisDialとして改訂された評価スキームのこれらのセットとコードをリリースする。
論文参考訳（メタデータ） (2020-04-20T13:26:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。