論文の概要: Communication-Efficient Collaborative Heterogeneous Bandits in Networks
- arxiv url: http://arxiv.org/abs/2303.05445v1
- Date: Thu, 9 Mar 2023 17:44:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-10 13:45:07.442138
- Title: Communication-Efficient Collaborative Heterogeneous Bandits in Networks
- Title(参考訳): ネットワークにおける通信効率の高い協調的異種バンドイット
- Authors: Junghyun Lee, Laura Schmid, Se-Young Yun
- Abstract要約: マルチエージェントのマルチアームバンディット問題は、多くの実生活応用においてその有用性のために広く研究されている。
我々は、ある通信プロトコルを介して、あるグラフ上で協調しながら、エージェントがグループ後悔を最小限に抑える設定について検討する。
- 参考スコア(独自算出の注目度): 12.160708336715489
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The multi-agent multi-armed bandit problem has been studied extensively due
to its ubiquity in many real-life applications, such as online recommendation
systems and wireless networking. We consider the setting where agents should
minimize their group regret while collaborating over a given graph via some
communication protocol and where each agent is given a different set of arms.
Previous literature on this problem only considered one of the two desired
features separately: agents with the same arm set communicate over a general
graph, or agents with different arm sets communicate over a fully connected
graph. In this work, we introduce a more general problem setting that
encompasses all the desired features. For this novel setting, we first provide
a rigorous regret analysis for the standard flooding protocol combined with the
UCB policy. Then, to mitigate the issue of high communication costs incurred by
flooding, we propose a new protocol called Flooding with Absorption (FWA). We
provide a theoretical analysis of the regret bound and intuitions on the
advantages of using FWA over flooding. Lastly, we verify empirically that using
FWA leads to significantly lower communication costs despite minimal regret
performance loss compared to flooding.
- Abstract(参考訳): マルチエージェントのマルチアームドバンディット問題は、オンラインレコメンデーションシステムやワイヤレスネットワークなど、多くの現実のアプリケーションで広く使われているため、広く研究されている。
我々は、エージェントが与えられたグラフ上でコミュニケーションプロトコルを介してコラボレーションしながらグループ後悔を最小限にし、それぞれのエージェントが異なるアームセットを与えられるような設定を考える。
同一のアームセットを持つエージェントが汎用グラフ上で通信するか、異なるアームセットを持つエージェントが完全に連結されたグラフ上で通信するかである。
本研究では,所望の機能をすべて包含する,より一般的な問題設定を導入する。
本稿では,本手法とucbポリシーを併用したフラッディングプロトコルについて,まず,厳格な後悔の分析を行う。
そして,洪水による通信コストの低減を図るため,Flooding with absorption (FWA)と呼ばれる新しいプロトコルを提案する。
洪水に対するfwaの利用の利点について, 後悔と直観の理論的分析を行った。
最後に,fwaの使用による通信コストの低下は,洪水による性能低下を最小限に抑えつつも有意に低いことを実証的に検証した。
関連論文リスト
- Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Communication-Efficient Zeroth-Order Distributed Online Optimization:
Algorithm, Theory, and Applications [9.045332526072828]
本稿では,目標追跡のためのフェデレーション学習環境におけるマルチエージェントゼロ階オンライン最適化問題に焦点を当てる。
提案手法は、2つの関連するアプリケーションにおけるエラーとエラーの観点からさらに解析される。
論文 参考訳(メタデータ) (2023-06-09T03:51:45Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - The Double-Edged Sword of Implicit Bias: Generalization vs. Robustness
in ReLU Networks [64.12052498909105]
本稿では,ReLUネットワークにおける勾配流の暗黙的バイアスが一般化と対角的ロバスト性に与える影響について検討する。
2層ReLUネットワークでは、勾配流は一般化された解に偏りがあるが、敵の例には非常に弱い。
論文 参考訳(メタデータ) (2023-03-02T18:14:35Z) - On Regret-optimal Cooperative Nonstochastic Multi-armed Bandits [7.23389716633927]
我々は,FTRLアルゴリズムが,下界を一定要素に整合した個々の後悔の上界を有することを示す。
また、エッジ遅延パラメータによるスケーリングに関して、適切な正規化器を持つFTRLアルゴリズムが最適であることを示す。
論文 参考訳(メタデータ) (2022-11-30T16:46:41Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - ADOM: Accelerated Decentralized Optimization Method for Time-Varying
Networks [124.33353902111939]
本稿では,時間変動ネットワーク上の滑らかかつ強凸分散最適化のための高速化手法である adom を提案する。
ネットワーク構造のみに依存する一定の要因まで、その通信は加速されたNesterovメソッドのそれと同じです。
論文 参考訳(メタデータ) (2021-02-18T09:37:20Z) - Decentralized Multi-Agent Linear Bandits with Safety Constraints [31.67685495996986]
本研究では,N$エージェントのネットワークが協調して線形帯域最適化問題を解く分散線形帯域幅について検討する。
ネットワーク全体の累積的後悔を最小限に抑える完全分散アルゴリズム DLUCB を提案する。
私たちのアイデアは、より困難な、安全な盗賊の設定にもかかわらず、自然界に広まっています。
論文 参考訳(メタデータ) (2020-12-01T07:33:00Z) - ESPN: Extremely Sparse Pruned Networks [50.436905934791035]
簡単な反復マスク探索法により,非常に深いネットワークの最先端の圧縮を実現することができることを示す。
本アルゴリズムは,シングルショット・ネットワーク・プルーニング法とロッテ・ティケット方式のハイブリッド・アプローチを示す。
論文 参考訳(メタデータ) (2020-06-28T23:09:27Z) - Coagent Networks Revisited [10.45819881530349]
共役ネットワークは、強化学習環境で行動を起こすために協力するエージェントの任意のネットワークの概念を定式化する。
まず、共役ネットワークに該当する多種多様な事例について統一的な視点を提供する。
我々は、新しい、直感的な実行パスのアイデアによって実現された、Coagentネットワークにおける実行のルールを形式化する。
論文 参考訳(メタデータ) (2020-01-28T17:31:23Z) - Information Compensation for Deep Conditional Generative Networks [38.054911004694624]
我々は、新しい情報補償接続(IC-Connection)を用いた教師なし条件付きGANのための新しい構造を提案する。
提案したIC-Connectionにより、GANはデコンボリューション操作中に発生する情報損失を補償することができる。
実験結果から,本手法は条件付き生成環境において,最先端のGANと比較して,より不整合性が高いことが示唆された。
論文 参考訳(メタデータ) (2020-01-23T14:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。