論文の概要: Incentivizing Truthfulness and Collaborative Fairness in Bayesian Learning
- arxiv url: http://arxiv.org/abs/2605.11889v1
- Date: Tue, 12 May 2026 10:02:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.784615
- Title: Incentivizing Truthfulness and Collaborative Fairness in Bayesian Learning
- Title(参考訳): ベイズ学習における真理と協調フェアネスの動機付け
- Authors: Rachael Hwee Ling Sim, Jue Fan, Xiao Tian, Xinyi Xu, Patrick Jaillet, Bryan Kian Hsiang Low,
- Abstract要約: コラボレーション型機械学習は、複数のソースからのデータセットを使用して高品質なモデルをトレーニングする。
ソースにデータを共有するインセンティブを与えるため、既存のデータ評価手法は、送信されたデータに基づいて各ソースに適切な報酬を与える。
本稿では, (F) 協調フェアネスを保証し, (T) ベイズモデルの平衡における真さを動機付ける最初のメカニズムを提案する。
- 参考スコア(独自算出の注目度): 68.76184067877499
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative machine learning involves training high-quality models using datasets from a number of sources. To incentivize sources to share data, existing data valuation methods fairly reward each source based on its data submitted as is. However, as these methods do not verify nor incentivize data truthfulness, the sources can manipulate their data (e.g., by submitting duplicated or noisy data) to artificially increase their valuations and rewards or prevent others from benefiting. This paper presents the first mechanism that provably ensures (F) collaborative fairness and incentivizes (T) truthfulness at equilibrium for Bayesian models. Our mechanism combines semivalues (e.g., Shapley value), which ensure fairness, and a truthful data valuation function (DVF) based on a validation set that is unknown to the sources. As semivalues are influenced by others' data, we introduce an additional condition to prove that a source can maximize its expected data values in coalitions and semivalues by submitting a dataset that captures its true knowledge. Additionally, we discuss the implications and suitable relaxations of (F) and (T) when the mediator has a limited budget for rewards or lacks a validation set. Our theoretical findings are validated on synthetic and real-world datasets.
- Abstract(参考訳): コラボレーション型機械学習は、複数のソースからのデータセットを使用して高品質なモデルをトレーニングする。
ソースにデータを共有するインセンティブを与えるため、既存のデータ評価手法は、送信されたデータに基づいて各ソースに適切な報酬を与える。
しかし、これらの手法はデータの真偽を検証したり、インセンティブを与えたりしないため、ソースはデータ(例えば、重複データやノイズデータを送信して)を操作して、評価や報酬を人為的に増やしたり、他人が利益を得るのを防ぐことができる。
本稿では, (F) 協調フェアネスを確実に保証し, (T) ベイズモデルの平衡における真さを動機付ける最初のメカニズムを提案する。
我々のメカニズムは、公平性を保証する半値(例えばShapley値)と、情報源に未知の検証セットに基づく真理データ評価関数(DVF)を組み合わせる。
半値が他者のデータに影響されているため、情報源が真の知識を捉えたデータセットを提出することで、アライアンスや半値における期待値が最大化できることを証明するための追加条件を導入する。
さらに, (F) と (T) の関連性や緩和性についても論じる。
我々の理論的知見は、合成および実世界のデータセット上で検証される。
関連論文リスト
- A Cramér-von Mises Approach to Incentivizing Truthful Data Sharing [10.731682970668142]
我々は,Cram'er-von Mises統計に触発された新しい2サンプルテストに基づいて報奨機構を開発する。
提案手法は,データ作成などの非現実的な報告を廃止しつつ,エージェントがより真にデータを送ることを強く動機づける。
論文 参考訳(メタデータ) (2025-06-08T20:14:48Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Fair and efficient contribution valuation for vertical federated learning [19.536358114259887]
フェデレートラーニング(Federated Learning)は、データを共有することなく、分散化されたデータソース間で機械学習モデルをトレーニングするための新興技術である。
本稿では,従来のシェープ値に基づいて,垂直結合シェープ値(VerFedSV)と呼ばれるコントリビューション評価指標を提案する。
We show that VerFedSV satisfed property of fairness but also effective to compute。
論文 参考訳(メタデータ) (2022-01-07T19:57:15Z) - Incentivizing Collaboration in Machine Learning via Synthetic Data
Rewards [26.850070556844628]
本稿では、データ提供に利害関係者間の協調を動機付ける新しい協調生成モデリング(CGM)フレームワークを提案する。
合成データを報酬として分配することは、下流の学習タスクにタスクとモデルに依存しない利点を提供する。
論文 参考訳(メタデータ) (2021-12-17T05:15:30Z) - Fair Densities via Boosting the Sufficient Statistics of Exponential
Families [72.34223801798422]
フェアネスのためのデータ前処理にブースティングアルゴリズムを導入する。
私たちのアプローチは、最小限の公平性を確保しながら、より良いデータフィッティングへとシフトします。
実世界のデータに結果の質を示す実験結果が提示される。
論文 参考訳(メタデータ) (2020-12-01T00:49:17Z) - A Principled Approach to Data Valuation for Federated Learning [73.19984041333599]
フェデレートラーニング(FL)は、分散データソース上で機械学習(ML)モデルをトレーニングする一般的なテクニックである。
Shapley value (SV) はデータ値の概念として多くのデシラタを満たすユニークなペイオフスキームを定義する。
本稿では,FL に対応する SV の変種を提案する。
論文 参考訳(メタデータ) (2020-09-14T04:37:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。