論文の概要: Differentially-Private Federated Linear Bandits
- arxiv url: http://arxiv.org/abs/2010.11425v1
- Date: Thu, 22 Oct 2020 03:58:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 06:04:42.313337
- Title: Differentially-Private Federated Linear Bandits
- Title(参考訳): 差動共役線形バンディット
- Authors: Abhimanyu Dubey and Alex Pentland
- Abstract要約: scFedUCBは、集中型と分散化された(ピアツーピア)フェデレーションラーニングのためのマルチエージェントプライベートアルゴリズムである。
我々は、その実用性に関する厳密な技術的分析を後悔の観点から提供し、協調的盗賊学習のいくつかの結果を改善し、厳密なプライバシー保証も提供します。
- 参考スコア(独自算出の注目度): 15.609414012418043
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid proliferation of decentralized learning systems mandates the need
for differentially-private cooperative learning. In this paper, we study this
in context of the contextual linear bandit: we consider a collection of agents
cooperating to solve a common contextual bandit, while ensuring that their
communication remains private. For this problem, we devise \textsc{FedUCB}, a
multiagent private algorithm for both centralized and decentralized
(peer-to-peer) federated learning. We provide a rigorous technical analysis of
its utility in terms of regret, improving several results in cooperative bandit
learning, and provide rigorous privacy guarantees as well. Our algorithms
provide competitive performance both in terms of pseudoregret bounds and
empirical benchmark performance in various multi-agent settings.
- Abstract(参考訳): 分散学習システムの急速な普及は、微分プライベートな協調学習の必要性を規定している。
本稿では,これらを文脈的線形バンドイットの文脈で検討し,共通のコンテキスト的バンドイットを解決するために協調するエージェントの集合について検討する。
そこで我々は,集中型および分散型(ピアツーピア)フェデレーション学習のためのマルチエージェントプライベートアルゴリズムである \textsc{FedUCB} を考案した。
我々は,後悔の観点でその有用性の厳密な技術的分析を行い,協調バンディット学習の結果をいくつか改善するとともに,厳密なプライバシー保証も提供する。
提案アルゴリズムは,種々のマルチエージェント設定において,擬似回帰境界と経験的ベンチマーク性能の両面で競合性能を提供する。
関連論文リスト
- Pure Exploration in Asynchronous Federated Bandits [57.02106627533004]
マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する方法について検討した。
信頼度を固定した純粋探索のための非同期マルチアームバンディットおよび線形バンディットアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-17T06:04:00Z) - Combating Exacerbated Heterogeneity for Robust Models in Federated
Learning [91.88122934924435]
対人訓練と連合学習の組み合わせは、望ましくない頑丈さの劣化につながる可能性がある。
我々は、Slack Federated Adversarial Training (SFAT)と呼ばれる新しいフレームワークを提案する。
各種ベンチマークおよび実世界のデータセットに対するSFATの合理性と有効性を検証する。
論文 参考訳(メタデータ) (2023-03-01T06:16:15Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Private and Byzantine-Proof Cooperative Decision-Making [15.609414012418043]
協調バンディット問題は、多腕バンディットと同時に相互作用するエージェントのグループを含むマルチエージェント決定問題である。
本稿では、エージェントがアクションシーケンスに関して通信をプライベートにしたい場合と、エージェントがビザンチンになり得る場合の2つの設定の下で、バンドイット問題を調査する。
我々は,(a)微分プライベートかつ(b)プライベートでありながら,最適な後悔を得る高信頼有界アルゴリズムを提供する。
我々の分散アルゴリズムはエージェント間の接続のネットワークに関する情報を必要とせず、大規模な動的システムにスケーラブルにします。
論文 参考訳(メタデータ) (2022-05-27T18:03:54Z) - Contextual Model Aggregation for Fast and Robust Federated Learning in
Edge Computing [88.76112371510999]
フェデレーション学習は、ネットワークエッジにおける分散機械学習の第一候補である。
既存のアルゴリズムは、性能の緩やかな収束や堅牢性の問題に直面している。
そこで本稿では,損失低減に対する最適コンテキスト依存境界を実現するためのコンテキストアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T21:42:31Z) - Finite-Time Consensus Learning for Decentralized Optimization with
Nonlinear Gossiping [77.53019031244908]
本稿では,非線形ゴシップ(NGO)に基づく分散学習フレームワークを提案する。
コミュニケーション遅延とランダム化チャットが学習にどう影響するかを解析することで,実践的なバリエーションの導出が可能となる。
論文 参考訳(メタデータ) (2021-11-04T15:36:25Z) - Privacy-Preserving Communication-Efficient Federated Multi-Armed Bandits [17.039484057126337]
通信ボトルネックとデータプライバシは、連邦化された多武装バンディット(MAB)問題において2つの重要な問題である。
このような問題に対して,プライバシ保存型通信効率アルゴリズムを設計し,後悔の観点から,プライバシ,コミュニケーション,学習性能の相互作用について検討する。
論文 参考訳(メタデータ) (2021-11-02T12:56:12Z) - Asynchronous Upper Confidence Bound Algorithms for Federated Linear
Bandits [35.47147821038291]
本稿では,同種クライアントと異種クライアントの集合に対する非同期モデル更新と通信を行う汎用フレームワークを提案する。
この分散学習フレームワークにおける後悔とコミュニケーションのコストに関する厳密な理論的分析が提供される。
論文 参考訳(メタデータ) (2021-10-04T14:01:32Z) - Instance-Dependent Complexity of Contextual Bandits and Reinforcement
Learning: A Disagreement-Based Perspective [104.67295710363679]
古典的なマルチアームバンディット問題において、インスタンス依存アルゴリズムは、ベストとセカンドベストのアーム間のギャップで「容易」な問題のパフォーマンスを向上させる。
我々は、インスタンス依存の後悔境界を得るのに十分かつ必要である複雑性尺度のファミリーを導入する。
次に、可能な限りギャップに適応する新しいオラクル効率アルゴリズムを導入し、最悪の場合にはミニマックスレートを得る。
論文 参考訳(メタデータ) (2020-10-07T01:33:06Z) - Kernel Methods for Cooperative Multi-Agent Contextual Bandits [15.609414012418043]
協調的マルチエージェント意思決定は、遅延のあるネットワーク上で通信しながら、学習問題を協調的に解決するエージェントのグループを含む。
エージェントが得られる報酬は、関連するカーネル再生ヒルベルト空間(RKHS)におけるコンテキストのイメージの任意の線形関数である。
我々は, 年齢ごとの後悔に対して, ほぼ最適境界を与えるアルゴリズムであるtextscCoop- KernelUCBを提案する。
論文 参考訳(メタデータ) (2020-08-14T07:37:44Z) - Federated Recommendation System via Differential Privacy [31.0963615274522]
差分プライバシーに基づくアッパー信頼境界法(UCB)をマルチエージェント環境に適用する方法について検討する。
提案手法のプライバシと後悔性能に関する理論的解析を行った。
論文 参考訳(メタデータ) (2020-05-14T00:00:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。