論文の概要: Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning
- arxiv url: http://arxiv.org/abs/2403.06535v1
- Date: Mon, 11 Mar 2024 09:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 19:43:03.272154
- Title: Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning
- Title(参考訳): 分散・生涯適応型マルチエージェント協調学習
- Authors: Shuo Tang, Rui Ye, Chenxin Xu, Xiaowen Dong, Siheng Chen, Yanfeng Wang
- Abstract要約: 分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
- 参考スコア(独自算出の注目度): 57.652899266553035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decentralized and lifelong-adaptive multi-agent collaborative learning aims
to enhance collaboration among multiple agents without a central server, with
each agent solving varied tasks over time. To achieve efficient collaboration,
agents should: i) autonomously identify beneficial collaborative relationships
in a decentralized manner; and ii) adapt to dynamically changing task
observations. In this paper, we propose DeLAMA, a decentralized multi-agent
lifelong collaborative learning algorithm with dynamic collaboration graphs. To
promote autonomous collaboration relationship learning, we propose a
decentralized graph structure learning algorithm, eliminating the need for
external priors. To facilitate adaptation to dynamic tasks, we design a memory
unit to capture the agents' accumulated learning history and knowledge, while
preserving finite storage consumption. To further augment the system's
expressive capabilities and computational efficiency, we apply algorithm
unrolling, leveraging the advantages of both mathematical optimization and
neural networks. This allows the agents to `learn to collaborate' through the
supervision of training tasks. Our theoretical analysis verifies that
inter-agent collaboration is communication efficient under a small number of
communication rounds. The experimental results verify its ability to facilitate
the discovery of collaboration strategies and adaptation to dynamic learning
scenarios, achieving a 98.80% reduction in MSE and a 188.87% improvement in
classification accuracy. We expect our work can serve as a foundational
technique to facilitate future works towards an intelligent, decentralized, and
dynamic multi-agent system. Code is available at
https://github.com/ShuoTang123/DeLAMA.
- Abstract(参考訳): 分散化および生涯適応型マルチエージェント協調学習は、複数のエージェント間のコラボレーションを中央サーバなしで強化することを目的としており、各エージェントは時間とともにさまざまなタスクを解決している。
効率的に協力するためには、エージェントは:
一 自律的に分散的に有益な協力関係を識別すること
二 動的に変化する課題観察に適応すること。
本稿では,動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
自律的な協調関係学習を促進するために,外部の事前情報を必要としない分散グラフ構造学習アルゴリズムを提案する。
動的タスクへの適応を容易にするため,記憶容量を有限に保ちながら,エージェントの蓄積した学習履歴と知識をキャプチャするメモリユニットを設計する。
システムの表現能力と計算効率をさらに強化するため,数理最適化とニューラルネットワークの利点を活かし,アルゴリズムの展開を行う。
これにより、エージェントはトレーニングタスクの監督を通じて‘学習者が協力する’ことができる。
我々の理論的分析は,少数のコミュニケーションラウンドにおいて,エージェント間コラボレーションがコミュニケーション効率が高いことを検証している。
実験結果は,mseの98.80%削減と分類精度の188.87%向上を実現し,協調戦略の発見と動的学習シナリオへの適応を促進する能力を検証する。
当社の作業は,インテリジェントで分散化された動的マルチエージェントシステムに向けた今後の作業を促進する基盤技術として機能することを期待しています。
コードはhttps://github.com/ShuoTang123/DeLAMAで入手できる。
関連論文リスト
- Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Asynchronous Message-Passing and Zeroth-Order Optimization Based Distributed Learning with a Use-Case in Resource Allocation in Communication Networks [11.182443036683225]
分散学習と適応は大きな関心を集め、機械学習信号処理に広く応用されている。
本稿では、エージェントが共通のタスクに向けて協調するシナリオに焦点を当てる。
送信者として働くエージェントは、グローバルな報酬を最大化するために、それぞれのポリシーを共同で訓練する。
論文 参考訳(メタデータ) (2023-11-08T11:12:27Z) - Unrolled Graph Learning for Multi-Agent Collaboration [37.239120967721156]
人間のコラボレーションにインスパイアされた分散マルチエージェント学習モデルを提案する。
エージェントは、適切なコラボレータを自律的に検出し、より良いパフォーマンスを得るためにコラボレータのモデルを参照することができる。
論文 参考訳(メタデータ) (2022-10-31T07:05:44Z) - Behaviour-conditioned policies for cooperative reinforcement learning
tasks [41.74498230885008]
現実世界の様々なタスクにおいて、エージェントは未知のパートナーエージェントタイプと協力する必要がある。
深層強化学習モデルは、必要な機能を提供するためにトレーニングすることができるが、サンプルの非効率性と遅い学習に苦しむことが知られている。
本研究では,行動パターンの異なるエージェントの集団を合成的に生成する手法を提案する。
また、生成されたデータを効率的に利用し、メタ学習能力を得ることができるエージェントアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-10-04T09:16:41Z) - Improving Multi-agent Coordination by Learning to Estimate Contention [24.52552750240412]
大規模システムにおける効率的かつ公平なアロケーションを実現するマルチエージェント学習アルゴリズムALMA-Learningを提案する。
ALMA-Learningは分散化され、独自のアクション/リワードペアのみを観察し、エージェント間通信を必要とせず、ほぼ最適(5%の損失)と公正な調整を達成する。
論文 参考訳(メタデータ) (2021-05-09T21:30:48Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。