論文の概要: Pure Exploration in Asynchronous Federated Bandits
- arxiv url: http://arxiv.org/abs/2310.11015v1
- Date: Tue, 17 Oct 2023 06:04:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 17:21:14.293671
- Title: Pure Exploration in Asynchronous Federated Bandits
- Title(参考訳): 非同期フェデレートバンディットにおける純粋探査
- Authors: Zichen Wang, Chuanhao Li, Chenyu Song, Lianghui Wang, Quanquan Gu,
Huazheng Wang
- Abstract要約: マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する方法について検討した。
信頼度を固定した純粋探索のための非同期マルチアームバンディットおよび線形バンディットアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 60.420423973886834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the federated pure exploration problem of multi-armed bandits and
linear bandits, where $M$ agents cooperatively identify the best arm via
communicating with the central server. To enhance the robustness against
latency and unavailability of agents that are common in practice, we propose
the first federated asynchronous multi-armed bandit and linear bandit
algorithms for pure exploration with fixed confidence. Our theoretical analysis
shows the proposed algorithms achieve near-optimal sample complexities and
efficient communication costs in a fully asynchronous environment. Moreover,
experimental results based on synthetic and real-world data empirically
elucidate the effectiveness and communication cost-efficiency of the proposed
algorithms.
- Abstract(参考訳): マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する。
実用上一般的なエージェントのレイテンシに対するロバスト性と有効性を高めるため,信頼度の高い純粋探索のために,最初のフェデレーション型非同期多腕バンディットおよび線形バンディットアルゴリズムを提案する。
提案アルゴリズムは, 完全非同期環境において, ほぼ最適サンプルの複雑さと効率的な通信コストを実現する。
さらに,合成および実世界のデータに基づく実験結果は,提案アルゴリズムの有効性と通信コスト効率を実証的に解明する。
関連論文リスト
- Federated Contextual Cascading Bandits with Asynchronous Communication
and Heterogeneous Users [95.77678166036561]
繊細な通信プロトコルを用いたUPB型アルゴリズムを提案する。
同期フレームワークで達成されたものと同等のサブ線形後悔境界を与えます。
合成および実世界のデータセットに関する実証評価は、後悔と通信コストの観点から、我々のアルゴリズムの優れた性能を検証する。
論文 参考訳(メタデータ) (2024-02-26T05:31:14Z) - Incentivized Communication for Federated Bandits [67.4682056391551]
我々は,サーバがインセンティブを提供することでクライアントにデータを共有する動機付けを行う,フェデレートされた盗賊に対するインセンティブ付きコミュニケーション問題を導入する。
本稿では,実証可能な通信とインセンティブコスト保証により,ほぼ最適の後悔を実現する,最初のインセンティブ付き通信プロトコルであるInc-FedUCBを提案する。
論文 参考訳(メタデータ) (2023-09-21T00:59:20Z) - Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。
線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文 参考訳(メタデータ) (2023-03-29T22:06:24Z) - Communication-Efficient Collaborative Best Arm Identification [6.861971769602314]
エージェントが協調して目的関数を学習するマルチエージェント学習モデルにおいて,バンドイット理論の基本的な問題であるトップ・m$腕識別について検討する。
私たちは、最大限のスピードアップを達成するための協調学習アルゴリズムの設計に興味を持っています。
論文 参考訳(メタデータ) (2022-08-18T19:02:29Z) - A Simple and Provably Efficient Algorithm for Asynchronous Federated
Contextual Linear Bandits [77.09836892653176]
我々は,M$エージェントが相互に協力して,中央サーバの助けを借りて,グローバルなコンテキスト線形バンドイット問題を解決するためのフェデレーション付きコンテキスト線形バンドイットについて検討した。
すべてのエージェントが独立して動作し、ひとつのエージェントとサーバ間の通信が他のエージェントの通信をトリガーしない非同期設定を考える。
texttFedLinUCBの後悔は$tildeO(dsqrtsum_m=1M T_m)$で、通信の複雑さは$tildeO(dM)であることを示す。
論文 参考訳(メタデータ) (2022-07-07T06:16:19Z) - Finite-Time Consensus Learning for Decentralized Optimization with
Nonlinear Gossiping [77.53019031244908]
本稿では,非線形ゴシップ(NGO)に基づく分散学習フレームワークを提案する。
コミュニケーション遅延とランダム化チャットが学習にどう影響するかを解析することで,実践的なバリエーションの導出が可能となる。
論文 参考訳(メタデータ) (2021-11-04T15:36:25Z) - On Reward-Free RL with Kernel and Neural Function Approximations:
Single-Agent MDP and Markov Game [140.19656665344917]
エージェントが事前に特定された報酬関数を使わずに環境を徹底的に探索することを目的とした報酬のないRL問題について検討する。
関数近似の文脈でこの問題に取り組み、強力な関数近似器を活用する。
我々は、カーネルとニューラルファンクション近似器を用いた、証明可能な効率の良い報酬なしRLアルゴリズムを確立した。
論文 参考訳(メタデータ) (2021-10-19T07:26:33Z) - Cooperative Multi-Agent Bandits with Heavy Tails [15.609414012418043]
エージェント群が共通のバンドイット問題と相互作用する,協調的マルチエージェント設定におけるヘビーテールバンドイット問題について検討する。
この設定における既存のバンディットのアルゴリズムは、平均化ベースの通信プロトコルから生じる信頼区間を利用する。
我々は,メッセージパッシングプロトコルを用いたロバストな推定を組み込んだ協調帯域の分散マルチエージェントアルゴリズムであるtextscMP-UCB を提案する。
論文 参考訳(メタデータ) (2020-08-14T08:34:32Z) - Task-Based Information Compression for Multi-Agent Communication
Problems with Channel Rate Constraints [28.727611928919725]
本稿では,情報圧縮アルゴリズム(SAIC)のステートアグリゲーションを導入し,定式化TBIC問題の解法を提案する。
その結果,SAICは割引報酬の総和でほぼ最適性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-28T18:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。