論文の概要: One More Step Towards Reality: Cooperative Bandits with Imperfect
Communication
- arxiv url: http://arxiv.org/abs/2111.12482v1
- Date: Wed, 24 Nov 2021 13:19:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-25 14:38:38.074459
- Title: One More Step Towards Reality: Cooperative Bandits with Imperfect
Communication
- Title(参考訳): 現実への一歩:不完全なコミュニケーションを伴う協調的帯域
- Authors: Udari Madhushani, Abhimanyu Dubey, Naomi Ehrich Leonard, Alex Pentland
- Abstract要約: 我々は,3つの典型的な実世界のコミュニケーションシナリオの下で協調的バンディット学習を研究する。
競争性能を実現する分散型アルゴリズムを提案する。
様々なネットワークトポロジにおいて既存の最先端技術よりも優れた遅延更新アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 15.440053226788562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The cooperative bandit problem is increasingly becoming relevant due to its
applications in large-scale decision-making. However, most research for this
problem focuses exclusively on the setting with perfect communication, whereas
in most real-world distributed settings, communication is often over stochastic
networks, with arbitrary corruptions and delays. In this paper, we study
cooperative bandit learning under three typical real-world communication
scenarios, namely, (a) message-passing over stochastic time-varying networks,
(b) instantaneous reward-sharing over a network with random delays, and (c)
message-passing with adversarially corrupted rewards, including byzantine
communication. For each of these environments, we propose decentralized
algorithms that achieve competitive performance, along with near-optimal
guarantees on the incurred group regret as well. Furthermore, in the setting
with perfect communication, we present an improved delayed-update algorithm
that outperforms the existing state-of-the-art on various network topologies.
Finally, we present tight network-dependent minimax lower bounds on the group
regret. Our proposed algorithms are straightforward to implement and obtain
competitive empirical performance.
- Abstract(参考訳): 大規模意思決定への応用により,共同バンディット問題は益々重要視されている。
しかしながら、この問題に関するほとんどの研究は完全なコミュニケーションの設定にのみ焦点を合わせているが、現実の分散環境では、通信はしばしば確率的ネットワーク上にあり、任意の腐敗と遅延がある。
本稿では,3つの現実的コミュニケーションシナリオ,すなわち,協調的バンディット学習について検討する。
(a)確率的時間変動ネットワーク上のメッセージパッシング
(b)ランダムな遅延のあるネットワーク上での即時報酬共有
(c)ビザンチン通信を含む相手側の報酬によるメッセージパッシング
それぞれの環境に対して,競合性能を実現する分散アルゴリズムを提案するとともに,帰属集団の後悔に対するほぼ最適保証も提案する。
さらに, 完全通信環境では, 様々なネットワークトポロジにおいて既存の最先端技術よりも優れた遅延更新アルゴリズムを提案する。
最後に,ネットワーク依存のミニマックス下限をグループ後悔に対して提示する。
提案アルゴリズムは, 競争力のある経験的性能を実現し, 実現し易い。
関連論文リスト
- Performance-Aware Self-Configurable Multi-Agent Networks: A Distributed Submodular Approach for Simultaneous Coordination and Network Design [3.5527561584422465]
本稿では、AlterNAting Coordination and Network-Design Algorithm(Anaconda)を紹介する。
Anacondaはスケーラブルなアルゴリズムで、ほぼ最適性を保証する。
地域モニタリングのシミュレーションシナリオを実演し,それを最先端のアルゴリズムと比較する。
論文 参考訳(メタデータ) (2024-09-02T18:11:33Z) - Overlay-based Decentralized Federated Learning in Bandwidth-limited Networks [3.9162099309900835]
分散連合学習(DFL)は、中央集権的調整なしに分散エージェントを直接学習することで、人工知能(AI)の展開を促進するという約束を持っている。
既存のソリューションの多くは、隣接するエージェントが基盤となる通信ネットワークに物理的に隣接しているという単純な仮定に基づいている。
我々は,帯域幅制限ネットワークにおける通信要求と通信スケジュールを,基礎となるネットワークからの明示的な協力を必要とせず,共同で設計する。
論文 参考訳(メタデータ) (2024-08-08T18:05:11Z) - Lower Bounds and Optimal Algorithms for Non-Smooth Convex Decentralized Optimization over Time-Varying Networks [57.24087627267086]
通信ネットワークのノード間で分散的に格納された凸関数の総和を最小化するタスクについて検討する。
この問題を解決するのに必要な分散通信数と(サブ)漸進計算の下位境界が確立されている。
我々は,これらの下界に適合する最初の最適アルゴリズムを開発し,既存の最先端技術と比較して理論性能を著しく向上させる。
論文 参考訳(メタデータ) (2024-05-28T10:28:45Z) - Adaptive Consensus: A network pruning approach for decentralized
optimization [0.5432724320036953]
ネットワーク内の各ノードが局所関数を持つネットワークベースの分散最適化問題を考える。
目的は、すべての局所関数の和を最小化するコンセンサス解を集合的に達成することである。
本稿では,通信量を削減する適応的ランダム化通信効率アルゴリズムフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-06T00:28:10Z) - Optimal Complexity in Non-Convex Decentralized Learning over
Time-Varying Networks [8.860889476382594]
時間変化ネットワークによる分散最適化は、機械学習の新たなパラダイムである。
大規模な深層トレーニングでは通信オーバーヘッドが大幅に削減され、特にノードの移動時の無線シナリオでは堅牢になる。
論文 参考訳(メタデータ) (2022-11-01T15:37:54Z) - Communication Efficient Distributed Learning for Kernelized Contextual
Bandits [58.78878127799718]
分散環境でのカーネル化されたコンテキスト帯域の学習における通信効率の課題に対処する。
我々は、エージェントが再現されたカーネルヒルベルト空間で協調的に探索できるようにすることにより、非線形報酬写像を考える。
我々は, 後悔とコミュニケーションの両コストにおいて, アルゴリズムがサブ線形レートを達成できることを厳格に証明した。
論文 参考訳(メタデータ) (2022-06-10T01:39:15Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Finite-Time Consensus Learning for Decentralized Optimization with
Nonlinear Gossiping [77.53019031244908]
本稿では,非線形ゴシップ(NGO)に基づく分散学習フレームワークを提案する。
コミュニケーション遅延とランダム化チャットが学習にどう影響するかを解析することで,実践的なバリエーションの導出が可能となる。
論文 参考訳(メタデータ) (2021-11-04T15:36:25Z) - Accelerating Federated Edge Learning via Optimized Probabilistic Device
Scheduling [57.271494741212166]
本稿では,通信時間最小化問題を定式化し,解決する。
最適化されたポリシーは、トレーニングプロセスが進むにつれて、残りの通信ラウンドの抑制から、ラウンドごとのレイテンシの低減へと、徐々に優先順位を転換している。
提案手法の有効性は,自律運転における協調的3次元目標検出のユースケースを通じて実証される。
論文 参考訳(メタデータ) (2021-07-24T11:39:17Z) - Competing Adaptive Networks [56.56653763124104]
適応エージェントのチーム間での分散競争のためのアルゴリズムを開発する。
本稿では,生成的対向ニューラルネットワークの分散学習への応用について述べる。
論文 参考訳(メタデータ) (2021-03-29T14:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。