論文の概要: From Fairness to Truthfulness: Rethinking Data Valuation Design
- arxiv url: http://arxiv.org/abs/2504.05563v1
- Date: Mon, 07 Apr 2025 23:34:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:28:27.489785
- Title: From Fairness to Truthfulness: Rethinking Data Valuation Design
- Title(参考訳): 公正から真実へ - データ評価設計の再考
- Authors: Dongyang Fan, Tyler J. Rotello, Sai Praneeth Karimireddy,
- Abstract要約: データ市場のデザインをゲーム理論のレンズで再考し、データ所有者はデータ共有のためのプライベートで異質なコストに直面します。
一般的に使われている評価手法は、これらのコストの真正な報告が失敗し、非効率な市場結果をもたらすことを示す。
我々は、Merson と Vickrey-Clarke-Groves というメカニズム設計から、よく確立された支払いルールをデータ市場設定に適用する。
- 参考スコア(独自算出の注目度): 12.067958128148112
- License:
- Abstract: As large language models increasingly rely on external data sources, fairly compensating data contributors has become a central concern. In this paper, we revisit the design of data markets through a game-theoretic lens, where data owners face private, heterogeneous costs for data sharing. We show that commonly used valuation methods--such as Leave-One-Out and Data Shapley--fail to ensure truthful reporting of these costs, leading to inefficient market outcomes. To address this, we adapt well-established payment rules from mechanism design, namely Myerson and Vickrey-Clarke-Groves (VCG), to the data market setting. We demonstrate that the Myerson payment is the minimal truthful payment mechanism, optimal from the buyer's perspective, and that VCG and Myerson payments coincide in unconstrained allocation settings. Our findings highlight the importance of incorporating incentive compatibility into data valuation, paving the way for more robust and efficient data markets.
- Abstract(参考訳): 大きな言語モデルがますます外部データソースに依存しているため、データコントリビュータの補償が中心的な関心事になっている。
本稿では,データ共有のためにデータ所有者がプライベートで異質なコストに直面しているゲーム理論レンズを用いて,データ市場の設計を再考する。
一般的に用いられる評価手法であるLeave-One-OutやData Shapleyは、これらのコストの真正な報告を保証し、非効率な市場効果をもたらすことを示す。
この問題を解決するため、マイソンとヴィクレー・クラーク・グラヴス(VCG)というメカニズム設計からデータ市場設定への確立された支払いルールを適用する。
我々は、マイソンの支払いが買い手の観点から最適である最小限の真理的な支払いメカニズムであり、VCGとマイソンの支払いは制約のない割当設定で一致することを実証する。
我々の発見は、インセンティブの互換性をデータ評価に取り入れることの重要性を強調し、より堅牢で効率的なデータ市場への道を開いた。
関連論文リスト
- Data Pricing for Graph Neural Networks without Pre-purchased Inspection [15.556650640576311]
モデルマーケットプレースでは、モデルトレーディングメカニズムを活用して、データ所有者に適切なインセンティブを与える。
本稿では、データの重要性を評価し、データ所有者を補償する構造的重要度に基づくモデル取引機構(SIMT)を提案する。
SIMTは、MacroF1とMicroF1の両方で、バニラベースラインを40%以上上回っている。
論文 参考訳(メタデータ) (2025-02-12T10:42:04Z) - An Instrumental Value for Data Production and its Application to Data Pricing [107.98697414652479]
本稿では,データ生成プロセスのインストゥルメンタルな価値を捉えるためのアプローチを開発する。
情報経済学における情報設計と信号の古典的概念とどのように結びつくかを示す。
論文 参考訳(メタデータ) (2024-12-24T03:53:57Z) - Pricing Strategies for Different Accuracy Models from the Same Dataset Based on Generalized Hotelling's Law [9.353146025394372]
販売者がデータセットをD$で保有し、市場で販売される様々なアキュラシーのモデルにトレーニングするシナリオを考察する。
データセットは、異なる精度でモデルをトレーニングするために再利用することができ、トレーニングコストは、販売量とは独立している。
論文 参考訳(メタデータ) (2024-04-08T08:02:18Z) - DAVED: Data Acquisition via Experimental Design for Data Markets [25.300193837833426]
本稿では,線形実験設計にインスパイアされたデータ取得問題に対するフェデレートされたアプローチを提案する。
提案手法はラベル付き検証データを必要とせずに予測誤差を低くする。
我々の研究の重要な洞察は、テストセット予測のためのデータ取得の利点を直接見積もる手法が、特に分散市場設定と互換性があることである。
論文 参考訳(メタデータ) (2024-03-20T18:05:52Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - Privacy-Aware Data Acquisition under Data Similarity in Regression Markets [29.64195175524365]
データの類似性とプライバシの嗜好が市場設計に不可欠であることを示す。
我々は、データ類似性が市場参加や取引データの価値にどのように影響するかを数値的に評価する。
論文 参考訳(メタデータ) (2023-12-05T09:39:04Z) - Mechanisms that Incentivize Data Sharing in Federated Learning [90.74337749137432]
我々は、データ共有の利点が完全に損なわれているような、ナイーブなスキームが破滅的なフリーライディングのレベルにどのように結びつくかを示す。
次に,各エージェントが生成するデータ量を最大化する精度形成機構を導入する。
論文 参考訳(メタデータ) (2022-07-10T22:36:52Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Data Sharing Markets [95.13209326119153]
我々は、各エージェントがデータの買い手および売り手の両方になり得る設定について検討する。
両データ交換(データ付きトレーディングデータ)と一方データ交換(お金付きトレーディングデータ)の2つの事例を考察する。
論文 参考訳(メタデータ) (2021-07-19T06:00:34Z) - A Principled Approach to Data Valuation for Federated Learning [73.19984041333599]
フェデレートラーニング(FL)は、分散データソース上で機械学習(ML)モデルをトレーニングする一般的なテクニックである。
Shapley value (SV) はデータ値の概念として多くのデシラタを満たすユニークなペイオフスキームを定義する。
本稿では,FL に対応する SV の変種を提案する。
論文 参考訳(メタデータ) (2020-09-14T04:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。