論文の概要: Communication-Efficient Collaborative Heterogeneous Bandits in Networks
- arxiv url: http://arxiv.org/abs/2303.05445v1
- Date: Thu, 9 Mar 2023 17:44:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-03-10 13:45:07.442138
- Title: Communication-Efficient Collaborative Heterogeneous Bandits in Networks
- Title(参考訳): ネットワークにおける通信効率の高い協調的異種バンドイット
- Authors: Junghyun Lee, Laura Schmid, Se-Young Yun
- Abstract要約: マルチエージェントのマルチアームバンディット問題は、多くの実生活応用においてその有用性のために広く研究されている。
我々は、ある通信プロトコルを介して、あるグラフ上で協調しながら、エージェントがグループ後悔を最小限に抑える設定について検討する。
- 参考スコア(独自算出の注目度): 12.160708336715489
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The multi-agent multi-armed bandit problem has been studied extensively due
to its ubiquity in many real-life applications, such as online recommendation
systems and wireless networking. We consider the setting where agents should
minimize their group regret while collaborating over a given graph via some
communication protocol and where each agent is given a different set of arms.
Previous literature on this problem only considered one of the two desired
features separately: agents with the same arm set communicate over a general
graph, or agents with different arm sets communicate over a fully connected
graph. In this work, we introduce a more general problem setting that
encompasses all the desired features. For this novel setting, we first provide
a rigorous regret analysis for the standard flooding protocol combined with the
UCB policy. Then, to mitigate the issue of high communication costs incurred by
flooding, we propose a new protocol called Flooding with Absorption (FWA). We
provide a theoretical analysis of the regret bound and intuitions on the
advantages of using FWA over flooding. Lastly, we verify empirically that using
FWA leads to significantly lower communication costs despite minimal regret
performance loss compared to flooding.
- Abstract(参考訳): マルチエージェントのマルチアームドバンディット問題は、オンラインレコメンデーションシステムやワイヤレスネットワークなど、多くの現実のアプリケーションで広く使われているため、広く研究されている。
我々は、エージェントが与えられたグラフ上でコミュニケーションプロトコルを介してコラボレーションしながらグループ後悔を最小限にし、それぞれのエージェントが異なるアームセットを与えられるような設定を考える。
同一のアームセットを持つエージェントが汎用グラフ上で通信するか、異なるアームセットを持つエージェントが完全に連結されたグラフ上で通信するかである。
本研究では,所望の機能をすべて包含する,より一般的な問題設定を導入する。
本稿では,本手法とucbポリシーを併用したフラッディングプロトコルについて,まず,厳格な後悔の分析を行う。
そして,洪水による通信コストの低減を図るため,Flooding with absorption (FWA)と呼ばれる新しいプロトコルを提案する。
洪水に対するfwaの利用の利点について, 後悔と直観の理論的分析を行った。
最後に,fwaの使用による通信コストの低下は,洪水による性能低下を最小限に抑えつつも有意に低いことを実証的に検証した。
関連論文リスト
- ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - When UAV Swarm Meets IRS: Collaborative Secure Communications in Low-altitude Wireless Networks [68.45202147860537]
低高度無線ネットワーク (LAWN) は、多様なアプリケーションに対して、拡張されたカバレッジ、信頼性、スループットを提供する。
これらのネットワークは、既知のおよび潜在的に未知の盗聴者の両方から重大なセキュリティ上の脆弱性に直面している。
本稿では,Swarm内で選択されたUAVを仮想アンテナアレイとして機能させる,LAWNのための新しいセキュア通信フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-25T02:02:14Z) - VariAntNet: Learning Decentralized Control of Multi-Agent Systems [2.5950969608246797]
単純なマルチエージェントシステムは、消防などの災害対応アプリケーションに効果的に利用することができる。
これらの単純なロボットエージェントは、Ant Robotsとしても知られており、限定的な知覚能力を持ち、共有座標系を持たない匿名エージェントとして定義されている。
本稿では,エージェントスワーミングと協調的なタスク実行を容易にするために,ディープラーニングに基づく分散制御モデルであるVariAntNetを提案する。
論文 参考訳(メタデータ) (2025-09-02T12:48:15Z) - MultiFuzz: A Dense Retrieval-based Multi-Agent System for Network Protocol Fuzzing [0.0]
MultiFuzz(マルチファズ)は、プロトコルファズリングのための、新しい高密度検索ベースのマルチエージェントシステムである。
セマンティック・アウェア・コンテキスト検索、特殊エージェント、構造化ツール支援推論を統合している。
ブランチカバレッジを大幅に改善し、より深いプロトコル状態と最先端のファジィの移行を探求する。
論文 参考訳(メタデータ) (2025-08-19T22:42:04Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust
Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。
パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文 参考訳(メタデータ) (2023-10-05T21:44:18Z) - Communication-Efficient Zeroth-Order Distributed Online Optimization:
Algorithm, Theory, and Applications [9.045332526072828]
本稿では,目標追跡のためのフェデレーション学習環境におけるマルチエージェントゼロ階オンライン最適化問題に焦点を当てる。
提案手法は、2つの関連するアプリケーションにおけるエラーとエラーの観点からさらに解析される。
論文 参考訳(メタデータ) (2023-06-09T03:51:45Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - The Double-Edged Sword of Implicit Bias: Generalization vs. Robustness
in ReLU Networks [64.12052498909105]
本稿では,ReLUネットワークにおける勾配流の暗黙的バイアスが一般化と対角的ロバスト性に与える影響について検討する。
2層ReLUネットワークでは、勾配流は一般化された解に偏りがあるが、敵の例には非常に弱い。
論文 参考訳(メタデータ) (2023-03-02T18:14:35Z) - On Regret-optimal Cooperative Nonstochastic Multi-armed Bandits [7.23389716633927]
我々は,FTRLアルゴリズムが,下界を一定要素に整合した個々の後悔の上界を有することを示す。
また、エッジ遅延パラメータによるスケーリングに関して、適切な正規化器を持つFTRLアルゴリズムが最適であることを示す。
論文 参考訳(メタデータ) (2022-11-30T16:46:41Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - ADOM: Accelerated Decentralized Optimization Method for Time-Varying
Networks [124.33353902111939]
本稿では,時間変動ネットワーク上の滑らかかつ強凸分散最適化のための高速化手法である adom を提案する。
ネットワーク構造のみに依存する一定の要因まで、その通信は加速されたNesterovメソッドのそれと同じです。
論文 参考訳(メタデータ) (2021-02-18T09:37:20Z) - Decentralized Multi-Agent Linear Bandits with Safety Constraints [31.67685495996986]
本研究では,N$エージェントのネットワークが協調して線形帯域最適化問題を解く分散線形帯域幅について検討する。
ネットワーク全体の累積的後悔を最小限に抑える完全分散アルゴリズム DLUCB を提案する。
私たちのアイデアは、より困難な、安全な盗賊の設定にもかかわらず、自然界に広まっています。
論文 参考訳(メタデータ) (2020-12-01T07:33:00Z) - ESPN: Extremely Sparse Pruned Networks [50.436905934791035]
簡単な反復マスク探索法により,非常に深いネットワークの最先端の圧縮を実現することができることを示す。
本アルゴリズムは,シングルショット・ネットワーク・プルーニング法とロッテ・ティケット方式のハイブリッド・アプローチを示す。
論文 参考訳(メタデータ) (2020-06-28T23:09:27Z) - Coagent Networks Revisited [10.45819881530349]
共役ネットワークは、強化学習環境で行動を起こすために協力するエージェントの任意のネットワークの概念を定式化する。
まず、共役ネットワークに該当する多種多様な事例について統一的な視点を提供する。
我々は、新しい、直感的な実行パスのアイデアによって実現された、Coagentネットワークにおける実行のルールを形式化する。
論文 参考訳(メタデータ) (2020-01-28T17:31:23Z) - Information Compensation for Deep Conditional Generative Networks [38.054911004694624]
我々は、新しい情報補償接続(IC-Connection)を用いた教師なし条件付きGANのための新しい構造を提案する。
提案したIC-Connectionにより、GANはデコンボリューション操作中に発生する情報損失を補償することができる。
実験結果から,本手法は条件付き生成環境において,最先端のGANと比較して,より不整合性が高いことが示唆された。
論文 参考訳(メタデータ) (2020-01-23T14:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。