論文の概要: Multi-agent Reinforcement Learning Improvement in a Dynamic Environment
Using Knowledge Transfer
- arxiv url: http://arxiv.org/abs/2107.09807v1
- Date: Tue, 20 Jul 2021 23:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-22 14:21:04.574561
- Title: Multi-agent Reinforcement Learning Improvement in a Dynamic Environment
Using Knowledge Transfer
- Title(参考訳): 知識伝達を用いた動的環境におけるマルチエージェント強化学習の改善
- Authors: Mahnoosh Mahdavimoghaddama, Amin Nikanjama, Monireh Abdoos
- Abstract要約: 協調型マルチエージェントシステムは、様々な領域で広く使われている。
これらのシステムは、大規模で未知の、動的環境を扱うための良い選択肢でもある。
しかし、これらの環境での学習は様々なアプリケーションにおいて非常に重要な課題となっている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cooperative multi-agent systems are being widely used in different domains.
Interaction among agents would bring benefits, including reducing operating
costs, high scalability, and facilitating parallel processing. These systems
are also a good option for handling large-scale, unknown, and dynamic
environments. However, learning in these environments has become a very
important challenge in various applications. These challenges include the
effect of search space size on learning time, inefficient cooperation among
agents, and the lack of proper coordination among agents' decisions. Moreover,
reinforcement learning algorithms may suffer from long convergence time in
these problems. In this paper, a communication framework using knowledge
transfer concepts is introduced to address such challenges in the herding
problem with large state space. To handle the problems of convergence,
knowledge transfer has been utilized that can significantly increase the
efficiency of reinforcement learning algorithms. Coordination between the
agents is carried out through a head agent in each group of agents and a
coordinator agent respectively. The results demonstrate that this framework
could indeed enhance the speed of learning and reduce convergence time.
- Abstract(参考訳): 協調型マルチエージェントシステムは様々な領域で広く使われている。
エージェント間のインタラクションは、運用コストの削減、スケーラビリティの向上、並列処理の容易化といったメリットをもたらす。
これらのシステムは、大規模で未知の、動的環境を扱うための良い選択肢でもある。
しかし、これらの環境での学習は様々なアプリケーションにおいて非常に重要な課題となっている。
これらの課題には、学習時間に対する探索空間の大きさの影響、エージェント間の非効率な協調、エージェントの判断における適切な調整の欠如が含まれる。
さらに、強化学習アルゴリズムはこれらの問題において長い収束時間に悩まされる可能性がある。
本稿では,知識伝達の概念を用いたコミュニケーション・フレームワークを導入し,大規模状態空間のハーディング問題における課題に対処する。
収束の問題に対処するために,強化学習アルゴリズムの効率を著しく向上させる知識伝達が活用されている。
各エージェント群におけるヘッドエージェントとコーディネータエージェントとを介して、エージェント間の調整を行う。
その結果,このフレームワークは学習の速度を向上し,収束時間を短縮する可能性が示唆された。
関連論文リスト
- Efficient Training in Multi-Agent Reinforcement Learning: A Communication-Free Framework for the Box-Pushing Problem [0.5524804393257919]
本稿では,自己組織化システムのための共有プール(SPI)モデルを提案する。
SPIは、情報を全てのエージェントにアクセスし、調整を容易にし、エージェント間の力の衝突を減らし、探索効率を高める。
論文 参考訳(メタデータ) (2024-11-19T05:51:10Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - Enabling Multi-Agent Transfer Reinforcement Learning via Scenario
Independent Representation [0.7366405857677227]
マルチエージェント強化学習(MARL)アルゴリズムは、エージェント間の協調や競合を必要とする複雑なタスクに広く採用されている。
本稿では,様々な状態空間を固定サイズの入力に統一することで,MARLの伝達学習を可能にする新しいフレームワークを提案する。
スクラッチから学習するエージェントと比較して,他のシナリオから学んだ操作スキルを用いたマルチエージェント学習性能の大幅な向上を示す。
論文 参考訳(メタデータ) (2024-02-13T02:48:18Z) - Inverse Factorized Q-Learning for Cooperative Multi-agent Imitation
Learning [13.060023718506917]
模倣学習(英: mimicion learning, IL)は、協調型マルチエージェントシステムにおける実証から専門家の行動を模倣する学習の課題である。
本稿では,これらの課題に対処する新しいマルチエージェントILアルゴリズムを提案する。
本手法は,分散Q関数の集約に混在するネットワークを活用することで,集中学習を実現する。
論文 参考訳(メタデータ) (2023-10-10T17:11:20Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Hierarchical Reinforcement Learning with Opponent Modeling for
Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。
従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。
効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文 参考訳(メタデータ) (2022-06-25T19:09:29Z) - Coach-assisted Multi-Agent Reinforcement Learning Framework for
Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。
本稿では,教師支援型多エージェント強化学習フレームワークを提案する。
私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文 参考訳(メタデータ) (2022-03-16T08:22:45Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - Multiagent Deep Reinforcement Learning: Challenges and Directions
Towards Human-Like Approaches [0.0]
本稿では,最も一般的なマルチエージェント問題表現とその主な課題について述べる。
これらの課題に対処する5つの研究領域を特定します。
我々は,マルチエージェント強化学習が成功するためには,これらの課題を学際的アプローチで解決することを提案する。
論文 参考訳(メタデータ) (2021-06-29T19:53:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。