論文の概要: Improving Multi-agent Coordination by Learning to Estimate Contention
- arxiv url: http://arxiv.org/abs/2105.04027v1
- Date: Sun, 9 May 2021 21:30:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 14:41:51.332233
- Title: Improving Multi-agent Coordination by Learning to Estimate Contention
- Title(参考訳): コンテンツ推定学習によるマルチエージェントコーディネーションの改善
- Authors: Panayiotis Danassis, Florian Wiedemair, Boi Faltings
- Abstract要約: 大規模システムにおける効率的かつ公平なアロケーションを実現するマルチエージェント学習アルゴリズムALMA-Learningを提案する。
ALMA-Learningは分散化され、独自のアクション/リワードペアのみを観察し、エージェント間通信を必要とせず、ほぼ最適(5%の損失)と公正な調整を達成する。
- 参考スコア(独自算出の注目度): 24.52552750240412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a multi-agent learning algorithm, ALMA-Learning, for efficient and
fair allocations in large-scale systems. We circumvent the traditional pitfalls
of multi-agent learning (e.g., the moving target problem, the curse of
dimensionality, or the need for mutually consistent actions) by relying on the
ALMA heuristic as a coordination mechanism for each stage game. ALMA-Learning
is decentralized, observes only own action/reward pairs, requires no
inter-agent communication, and achieves near-optimal (<5% loss) and fair
coordination in a variety of synthetic scenarios and a real-world meeting
scheduling problem. The lightweight nature and fast learning constitute
ALMA-Learning ideal for on-device deployment.
- Abstract(参考訳): 大規模システムにおける効率的かつ公平なアロケーションのためのマルチエージェント学習アルゴリズムALMA-Learningを提案する。
各ステージゲームにおける協調機構としてALMAヒューリスティックに依存することにより,マルチエージェント学習の伝統的な落とし穴(移動対象問題,次元の呪い,相互に一貫した行動の必要性など)を回避する。
ALMA-Learningは分散化され、独自のアクション/リワードペアのみを観察し、エージェント間通信を必要としない。
軽量な性質と高速学習は、デバイス上でのデプロイメントに理想的なALMA学習である。
関連論文リスト
- Decentralized multi-agent reinforcement learning algorithm using a cluster-synchronized laser network [1.124958340749622]
競合するマルチアームバンディット問題に対処するフォトニクスに基づく意思決定アルゴリズムを提案する。
シミュレーションにより,光結合型レーザーのカオス振動とクラスタ同期,分散結合調整,探索と利用の効率向上が示された。
論文 参考訳(メタデータ) (2024-07-12T09:38:47Z) - LoRA-Ensemble: Efficient Uncertainty Modelling for Self-attention Networks [52.46420522934253]
本稿では,自己注意ネットワークのためのパラメータ効率の高いディープアンサンブル手法であるLoRA-Ensembleを紹介する。
全メンバー間で重みを共有できる1つの事前学習型自己注意ネットワークを利用することで、注意投影のために、メンバー固有の低ランク行列を訓練する。
提案手法は明示的なアンサンブルよりも優れたキャリブレーションを示し,様々な予測タスクやデータセットに対して類似あるいは良好な精度を実現する。
論文 参考訳(メタデータ) (2024-05-23T11:10:32Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Learning in Cooperative Multiagent Systems Using Cognitive and Machine
Models [1.0742675209112622]
マルチエージェントシステム(MAS)は、人間との協調と協調を必要とする多くのアプリケーションにとって重要である。
一つの大きな課題は、動的環境における独立したエージェントの同時学習と相互作用である。
我々はMulti-Agent IBLモデル(MAIBL)の3つの変種を提案する。
我々は,MAIBLモデルが学習速度を向上し,動的CMOTPタスクにおいて,現在のMADRLモデルと比較して様々な報酬設定でコーディネートを達成できることを実証した。
論文 参考訳(メタデータ) (2023-08-18T00:39:06Z) - A Variational Approach to Mutual Information-Based Coordination for
Multi-Agent Reinforcement Learning [17.893310647034188]
マルチエージェント強化学習のための新しい相互情報フレームワークを提案する。
導出された下界を最大化するためにポリシーを適用することで,多エージェントアクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクタ-アクティベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-01T12:21:30Z) - Energy-Efficient Multi-Orchestrator Mobile Edge Learning [54.28419430315478]
Mobile Edge Learning(MEL)は、エッジデバイス上で機械学習(ML)モデルの分散トレーニングを特徴とする、協調学習パラダイムである。
MELでは、異なるデータセットで複数の学習タスクが共存する可能性がある。
本稿では, エネルギー消費, 精度, 解複雑性のトレードオフを容易にする軽量なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-02T07:37:10Z) - Toward Multiple Federated Learning Services Resource Sharing in Mobile
Edge Networks [88.15736037284408]
本稿では,マルチアクセスエッジコンピューティングサーバにおいて,複数のフェデレーション付き学習サービスの新たなモデルについて検討する。
共同資源最適化とハイパーラーニング率制御の問題,すなわちMS-FEDLを提案する。
シミュレーションの結果,提案アルゴリズムの収束性能を実証した。
論文 参考訳(メタデータ) (2020-11-25T01:29:41Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。