論文の概要: martFL: Enabling Utility-Driven Data Marketplace with a Robust and Verifiable Federated Learning Architecture
- arxiv url: http://arxiv.org/abs/2309.01098v4
- Date: Thu, 9 May 2024 08:50:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-10 18:19:06.790125
- Title: martFL: Enabling Utility-Driven Data Marketplace with a Robust and Verifiable Federated Learning Architecture
- Title(参考訳): martFL: 堅牢で検証可能なフェデレーション学習アーキテクチャによるユーティリティ駆動型データマーケットプレースの実現
- Authors: Qi Li, Zhuotao Liu, Qi Li, Ke Xu,
- Abstract要約: セキュアなユーティリティ駆動型データマーケットプレースを実現するために特別に設計された,最初のフェデレーション付き学習アーキテクチャであるmartFLを提案する。
MartFLは、2つの革新的な設計によって実現されている: (i) 堅牢な局所モデル集約を実現する品質対応モデル集約プロトコル。
martFLは,データ取得コストを最大64%削減しながら,モデル精度を最大25%向上できることを示す。
- 参考スコア(独自算出の注目度): 20.546797115997375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of machine learning models requires a large amount of training data. Data marketplaces are essential for trading high-quality, private-domain data not publicly available online. However, due to growing data privacy concerns, direct data exchange is inappropriate. Federated Learning (FL) is a distributed machine learning paradigm that exchanges data utilities (in form of local models or gradients) among multiple parties without directly sharing the raw data. However, several challenges exist when applying existing FL architectures to construct a data marketplace: (i) In existing FL architectures, Data Acquirers (DAs) cannot privately evaluate local models from Data Providers (DPs) prior to trading; (ii) Model aggregation protocols in existing FL designs struggle to exclude malicious DPs without "overfitting" to the DA's (possibly biased) root dataset; (iii) Prior FL designs lack a proper billing mechanism to enforce the DA to fairly allocate the reward according to contributions made by different DPs. To address above challenges, we propose martFL, the first federated learning architecture that is specifically designed to enable a secure utility-driven data marketplace. At a high level, martFL is powered by two innovative designs: (i) a quality-aware model aggregation protocol that achieves robust local model aggregation even when the DA's root dataset is biased; (ii) a verifiable data transaction protocol that enables the DA to prove, both succinctly and in zero-knowledge, that it has faithfully aggregates the local models submitted by different DPs according to the committed aggregation weights, based on which the DPs can unambiguously claim the corresponding reward. We implement a prototype of martFL and evaluate it extensively over various tasks. The results show that martFL can improve the model accuracy by up to 25% while saving up to 64% data acquisition cost.
- Abstract(参考訳): 機械学習モデルの開発には大量のトレーニングデータが必要である。
データ市場は、オンラインで公開されていない高品質のプライベートドメインデータの取引に不可欠である。
しかし、データプライバシの懸念が高まっているため、ダイレクトデータ交換は不適切である。
Federated Learning(FL)は、データユーティリティ(ローカルモデルや勾配の形式で)を、生データを直接共有することなく、複数のパーティ間で交換する分散機械学習パラダイムである。
しかし、データマーケットプレースを構築するために既存のFLアーキテクチャを適用する際には、いくつかの課題がある。
一 既存のFLアーキテクチャにおいて、データ取得者(DA)は、取引前にデータ提供者(DP)からローカルモデルをプライベートに評価することができません。
2 既存のFL設計におけるモデル集約プロトコルは、DAの(おそらくバイアスのある)ルートデータセットに「過度に適合」することなく、悪意のあるDPを排除するのに苦労する。
三 事前のFL設計は、異なるDPの貢献に応じて報酬を適正に配分するようDAに強制する適切な請求機構を欠いている。
上記の課題に対処するため,我々は,セキュアなユーティリティ駆動型データマーケットプレースを実現するために特別に設計された,最初のフェデレーション付き学習アーキテクチャであるmartFLを提案する。
高いレベルでは、martFLは2つの革新的な設計によって駆動される。
i)DAのルートデータセットがバイアスを受けた場合でも、ロバストな局所モデルアグリゲーションを実現する品質対応モデルアグリゲーションプロトコル
i)DAが簡潔かつゼロ知識の両方で証明できる検証可能なデータトランザクションプロトコルであって、コミットされた集約重みに応じて異なるDPが提出したローカルモデルを忠実に集約し、DPがそれに対応する報酬を明白に主張できるものであること。
我々は、martFLのプロトタイプを実装し、様々なタスクに対して広範囲に評価する。
その結果,データ取得コストを最大64%削減しつつ,モデル精度を最大25%向上させることができることがわかった。
関連論文リスト
- FedMAP: Unlocking Potential in Personalized Federated Learning through Bi-Level MAP Optimization [11.040916982022978]
フェデレートラーニング(FL)は、分散データに基づく機械学習モデルの協調トレーニングを可能にする。
クライアント間でのデータはしばしば、クラス不均衡、特徴分散スキュー、サンプルサイズ不均衡、その他の現象によって大きく異なる。
本稿では,バイレベル最適化を用いた新しいベイズPFLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T11:28:06Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - pFedSim: Similarity-Aware Model Aggregation Towards Personalized
Federated Learning [27.668944118750115]
モデルトレーニング中にデータのプライバシを保護するために、フェデレーション学習(FL)パラダイムが出現する。
FLの最大の課題の1つは、IID以外の(同一で、独立に分散されていない)データにある。
本稿では,モデル類似性に基づく新しいpFedSimアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-25T04:25:55Z) - Knowledge Distillation for Federated Learning: a Practical Guide [8.2791533759453]
フェデレートラーニング(FL)は、センシティブな生データを集中的に収集することなく、ディープラーニングモデルのトレーニングを可能にする。
FLの最もよく使われるアルゴリズムはパラメータに基づくスキーム(フェデレート平均化など)である。
我々は、特定のFL問題に適したKDベースのアルゴリズムのレビューを行う。
論文 参考訳(メタデータ) (2022-11-09T08:31:23Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - FEDIC: Federated Learning on Non-IID and Long-Tailed Data via Calibrated
Distillation [54.2658887073461]
非IIDデータの処理は、フェデレーション学習における最も難しい問題の1つである。
本稿では, フェデレート学習における非IIDデータとロングテールデータの結合問題について検討し, フェデレート・アンサンブル蒸留と不均衡(FEDIC)という対応ソリューションを提案する。
FEDICはモデルアンサンブルを使用して、非IIDデータでトレーニングされたモデルの多様性を活用する。
論文 参考訳(メタデータ) (2022-04-30T06:17:36Z) - Federated Learning from Only Unlabeled Data with
Class-Conditional-Sharing Clients [98.22390453672499]
Supervised Federated Learning (FL)は、複数のクライアントがラベル付きデータを共有せずにトレーニングされたモデルを共有することを可能にする。
本研究では,教師なし学習(FedUL)のフェデレーションを提案し,各クライアントのラベル付きデータにラベル付きデータを変換する。
論文 参考訳(メタデータ) (2022-04-07T09:12:00Z) - Semi-Supervised Federated Learning with non-IID Data: Algorithm and
System Design [42.63120623012093]
フェデレートラーニング(FL)は、エッジデバイス(またはクライアント)がデータをローカルに保持し、同時に共有グローバルモデルをトレーニングすることを可能にする。
クライアントのローカルトレーニングデータの分布は、非独立に均等に分散されている(非IID)
本稿では、FLにおけるデータ可用性と非IIDの問題を解決することを目的とした、堅牢な半教師付きFLシステム設計を提案する。
論文 参考訳(メタデータ) (2021-10-26T03:41:48Z) - A Principled Approach to Data Valuation for Federated Learning [73.19984041333599]
フェデレートラーニング(FL)は、分散データソース上で機械学習(ML)モデルをトレーニングする一般的なテクニックである。
Shapley value (SV) はデータ値の概念として多くのデシラタを満たすユニークなペイオフスキームを定義する。
本稿では,FL に対応する SV の変種を提案する。
論文 参考訳(メタデータ) (2020-09-14T04:37:54Z) - Distillation-Based Semi-Supervised Federated Learning for
Communication-Efficient Collaborative Training with Non-IID Private Data [8.935169114460663]
本研究では,主にインクリメンタルなコミュニケーションコストを克服するフェデレートラーニング(FL)フレームワークを開発する。
モバイル端末間でローカルモデルの出力を交換する蒸留に基づく半教師付きFLアルゴリズムを提案する。
DS-FLでは、通信コストはモデルの出力次元にのみ依存し、モデルサイズに応じてスケールアップしない。
論文 参考訳(メタデータ) (2020-08-14T03:47:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。