論文の概要: Self-Configurable Mesh-Networks for Scalable Distributed Submodular Bandit Optimization
- arxiv url: http://arxiv.org/abs/2602.19366v1
- Date: Sun, 22 Feb 2026 22:36:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.636697
- Title: Self-Configurable Mesh-Networks for Scalable Distributed Submodular Bandit Optimization
- Title(参考訳): スケーラブル分散サブモジュール帯域最適化のための自己構成可能なメッシュネットワーク
- Authors: Zirui Xu, Vasileios Tzoumas,
- Abstract要約: 本研究では、帯域幅、データレート、接続性において、現実的な通信制約の下で分散帯域のサブモジュール協調をスケールする方法について検討する。
提案手法は,エージェントの通信エリアを時間とともに最適化することにより,ほぼ最適な行動調整を可能にする。
より高速に収束し、帯域幅のサブモジュラー調整のためのベンチマークより優れ、環境の事前知識によって特権付けられるベンチマークよりも優れていることが観察される。
- 参考スコア(独自算出の注目度): 6.522338519818377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study how to scale distributed bandit submodular coordination under realistic communication constraints in bandwidth, data rate, and connectivity. We are motivated by multi-agent tasks of active situational awareness in unknown, partially-observable, and resource-limited environments, where the agents must coordinate through agent-to-agent communication. Our approach enables scalability by (i) limiting information relays to only one-hop communication and (ii) keeping inter-agent messages small, having each agent transmit only its own action information. Despite these information-access restrictions, our approach enables near-optimal action coordination by optimizing the agents' communication neighborhoods over time, through distributed online bandit optimization, subject to the agents' bandwidth constraints. Particularly, our approach enjoys an anytime suboptimality bound that is also strictly positive for arbitrary network topologies, even disconnected. To prove the bound, we define the Value of Coordination (VoC), an information-theoretic metric that quantifies for each agent the benefit of information access to its neighbors. We validate in simulations the scalability and near-optimality of our approach: it is observed to converge faster, outperform benchmarks for bandit submodular coordination, and can even outperform benchmarks that are privileged with a priori knowledge of the environment.
- Abstract(参考訳): 本研究では、帯域幅、データレート、接続性において、現実的な通信制約の下で分散帯域のサブモジュール協調をスケールする方法について検討する。
我々は,エージェントとエージェントのコミュニケーションを通じてエージェントが協調しなくてはならない,未知の,部分的に観測可能な,リソース制限された環境において,状況認識を活発に行うマルチエージェントタスクによって動機付けられている。
当社のアプローチはスケーラビリティを実現する
一 情報中継をワンホップ通信に限る。
二 エージェント間メッセージを小さく保ち、各エージェントが独自の行動情報のみを送信すること。
このような情報アクセス制限にもかかわらず,本手法はエージェントの帯域幅制約を考慮した分散オンライン帯域幅最適化により,エージェントの通信エリアを時間とともに最適化することにより,ほぼ最適動作調整を可能にする。
特に、我々のアプローチは任意のネットワークトポロジに対して厳密な正の任意の部分最適境界を享受し、また切断することさえある。
この境界を証明すべく、各エージェントが隣人への情報アクセスの利点を定量化するための情報理論の指標である値・オブ・コーディネーション(VoC)を定義した。
我々は,我々のアプローチのスケーラビリティとほぼ最適性をシミュレーションで検証し,より高速に収束し,帯域幅のサブモジュール調整のベンチマークよりも優れ,環境の優先知識に恵まれるベンチマークよりも優れることを示した。
関連論文リスト
- AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [77.62279834617475]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。
提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文 参考訳(メタデータ) (2025-06-21T18:34:43Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Performance-Aware Self-Configurable Multi-Agent Networks: A Distributed Submodular Approach for Simultaneous Coordination and Network Design [3.5527561584422465]
本稿では、AlterNAting Coordination and Network-Design Algorithm(Anaconda)を紹介する。
Anacondaはスケーラブルなアルゴリズムで、ほぼ最適性を保証する。
地域モニタリングのシミュレーションシナリオを実演し,それを最先端のアルゴリズムと比較する。
論文 参考訳(メタデータ) (2024-09-02T18:11:33Z) - Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの非絶対的実行から平均フィールドゲームにおいて平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
ポリシー情報の交換は,ネットワーク化されたエージェントが,機能近似設定において,独立エージェントと集中エージェントの両方より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-21T13:32:46Z) - Asynchronous Message-Passing and Zeroth-Order Optimization Based Distributed Learning with a Use-Case in Resource Allocation in Communication Networks [11.182443036683225]
分散学習と適応は大きな関心を集め、機械学習信号処理に広く応用されている。
本稿では、エージェントが共通のタスクに向けて協調するシナリオに焦点を当てる。
送信者として働くエージェントは、グローバルな報酬を最大化するために、それぞれのポリシーを共同で訓練する。
論文 参考訳(メタデータ) (2023-11-08T11:12:27Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Depthwise Convolution for Multi-Agent Communication with Enhanced
Mean-Field Approximation [9.854975702211165]
本稿では,MARL(Multi-agent RL)課題に取り組むための,局所的なコミュニケーション学習に基づく新しい手法を提案する。
まず,局所的な関係を効率的に抽出する深層的畳み込み機能を利用する新しい通信プロトコルを設計する。
第2に,エージェント相互作用の規模を減らすために,平均場近似を導入する。
論文 参考訳(メタデータ) (2022-03-06T07:42:43Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - One More Step Towards Reality: Cooperative Bandits with Imperfect
Communication [15.440053226788562]
我々は,3つの典型的な実世界のコミュニケーションシナリオの下で協調的バンディット学習を研究する。
競争性能を実現する分散型アルゴリズムを提案する。
様々なネットワークトポロジにおいて既存の最先端技術よりも優れた遅延更新アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-24T13:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。