Fugu-MT 論文翻訳(概要): Multi-agent Reinforcement Learning Improvement in a Dynamic Environment Using Knowledge Transfer

論文の概要: Multi-agent Reinforcement Learning Improvement in a Dynamic Environment Using Knowledge Transfer

arxiv url: http://arxiv.org/abs/2107.09807v1
Date: Tue, 20 Jul 2021 23:42:39 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-22 14:21:04.574561
Title: Multi-agent Reinforcement Learning Improvement in a Dynamic Environment Using Knowledge Transfer
Title（参考訳）: 知識伝達を用いた動的環境におけるマルチエージェント強化学習の改善
Authors: Mahnoosh Mahdavimoghaddama, Amin Nikanjama, Monireh Abdoos
Abstract要約: 協調型マルチエージェントシステムは、様々な領域で広く使われている。これらのシステムは、大規模で未知の、動的環境を扱うための良い選択肢でもある。しかし、これらの環境での学習は様々なアプリケーションにおいて非常に重要な課題となっている。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cooperative multi-agent systems are being widely used in different domains. Interaction among agents would bring benefits, including reducing operating costs, high scalability, and facilitating parallel processing. These systems are also a good option for handling large-scale, unknown, and dynamic environments. However, learning in these environments has become a very important challenge in various applications. These challenges include the effect of search space size on learning time, inefficient cooperation among agents, and the lack of proper coordination among agents' decisions. Moreover, reinforcement learning algorithms may suffer from long convergence time in these problems. In this paper, a communication framework using knowledge transfer concepts is introduced to address such challenges in the herding problem with large state space. To handle the problems of convergence, knowledge transfer has been utilized that can significantly increase the efficiency of reinforcement learning algorithms. Coordination between the agents is carried out through a head agent in each group of agents and a coordinator agent respectively. The results demonstrate that this framework could indeed enhance the speed of learning and reduce convergence time.
Abstract（参考訳）: 協調型マルチエージェントシステムは様々な領域で広く使われている。エージェント間のインタラクションは、運用コストの削減、スケーラビリティの向上、並列処理の容易化といったメリットをもたらす。これらのシステムは、大規模で未知の、動的環境を扱うための良い選択肢でもある。しかし、これらの環境での学習は様々なアプリケーションにおいて非常に重要な課題となっている。これらの課題には、学習時間に対する探索空間の大きさの影響、エージェント間の非効率な協調、エージェントの判断における適切な調整の欠如が含まれる。さらに、強化学習アルゴリズムはこれらの問題において長い収束時間に悩まされる可能性がある。本稿では,知識伝達の概念を用いたコミュニケーション・フレームワークを導入し,大規模状態空間のハーディング問題における課題に対処する。収束の問題に対処するために,強化学習アルゴリズムの効率を著しく向上させる知識伝達が活用されている。各エージェント群におけるヘッドエージェントとコーディネータエージェントとを介して、エージェント間の調整を行う。その結果,このフレームワークは学習の速度を向上し,収束時間を短縮する可能性が示唆された。

関連論文リスト

Communication Methods in Multi-Agent Reinforcement Learning [0.0]
本稿では,マルチエージェント強化学習におけるコミュニケーション技術の概要について述べる。このトピックに関する29の出版物の詳細な分析により、明示的、暗黙的、注目的、グラフ的、階層的/ロール的コミュニケーションの長所と短所が評価される。
論文参考訳（メタデータ） (2026-01-19T09:39:00Z)
Scalable Multiagent Reinforcement Learning with Collective Influence Estimation [5.050035210247092]
本稿では,集団影響推定ネットワークを付加したマルチエージェント学習フレームワークを提案する。タスクオブジェクトに対する他のエージェントの集団的影響を明示的にモデル化することにより、各エージェントはクリティカルな相互作用情報を推測することができる。実験の結果,提案手法は通信制限環境下での安定かつ効率的な協調を実現することがわかった。
論文参考訳（メタデータ） (2026-01-13T04:24:11Z)
FAST: Similarity-based Knowledge Transfer for Efficient Policy Learning [57.4737157531239]
Transfer Learningは、タスク間で知識を伝達することで学習を加速する能力を提供する。これは、負の転送、ドメイン適応、ソリッドソースポリシーの選択における非効率といった重要な課題に直面します。本研究では,知識伝達の改善,タスク間のパフォーマンスの促進,計算コストの削減など,TLの課題に挑戦する。
論文参考訳（メタデータ） (2025-07-27T22:21:53Z)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development [65.94639060883475]
本稿では,リソースを意識したマルチエージェントシステムであるCo-Savingを提案する。私たちの重要なイノベーションは、"ショートカット"の導入です。最先端のMAS ChatDevと比較して,トークン使用量の平均50.85%の削減を実現している。
論文参考訳（メタデータ） (2025-05-28T02:23:53Z)
Multi-Agent Collaboration via Evolving Orchestration [61.93162413517026]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。 LLMをベースとしたマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し、中央オーケストレータがタスク状態の進化に応じてエージェントを動的に指示する。クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文参考訳（メタデータ） (2025-05-26T07:02:17Z)
Combining Planning and Reinforcement Learning for Solving Relational Multiagent Domains [16.56659112347106]
MARL(Multiagent Reinforcement Learning)は、状態空間と行動空間の指数的成長によって大きな課題を提起する。本稿では,効率的な状態抽象化と強化学習を備えた集中型コントローラとしてリレーショナルプランナを統合することを提案する。
論文参考訳（メタデータ） (2025-02-26T16:55:23Z)
Efficient Training in Multi-Agent Reinforcement Learning: A Communication-Free Framework for the Box-Pushing Problem [0.5524804393257919]
本稿では,自己組織化システムのための共有プール(SPI)モデルを提案する。 SPIは、情報を全てのエージェントにアクセスし、調整を容易にし、エージェント間の力の衝突を減らし、探索効率を高める。
論文参考訳（メタデータ） (2024-11-19T05:51:10Z)
Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文参考訳（メタデータ） (2024-11-01T05:56:51Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文参考訳（メタデータ） (2024-03-11T09:21:11Z)
Enabling Multi-Agent Transfer Reinforcement Learning via Scenario Independent Representation [0.7366405857677227]
マルチエージェント強化学習(MARL)アルゴリズムは、エージェント間の協調や競合を必要とする複雑なタスクに広く採用されている。本稿では,様々な状態空間を固定サイズの入力に統一することで,MARLの伝達学習を可能にする新しいフレームワークを提案する。スクラッチから学習するエージェントと比較して,他のシナリオから学んだ操作スキルを用いたマルチエージェント学習性能の大幅な向上を示す。
論文参考訳（メタデータ） (2024-02-13T02:48:18Z)
Inverse Factorized Q-Learning for Cooperative Multi-agent Imitation Learning [13.060023718506917]
模倣学習(英: mimicion learning, IL)は、協調型マルチエージェントシステムにおける実証から専門家の行動を模倣する学習の課題である。本稿では,これらの課題に対処する新しいマルチエージェントILアルゴリズムを提案する。本手法は,分散Q関数の集約に混在するネットワークを活用することで,集中学習を実現する。
論文参考訳（メタデータ） (2023-10-10T17:11:20Z)
Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文参考訳（メタデータ） (2023-03-24T15:12:28Z)
Hierarchical Reinforcement Learning with Opponent Modeling for Distributed Multi-agent Cooperation [13.670618752160594]
深層強化学習(DRL)はエージェントと環境の相互作用を通じて多エージェント協調に有望なアプローチを提供する。従来のDRLソリューションは、ポリシー探索中に連続的なアクション空間を持つ複数のエージェントの高次元に悩まされる。効率的な政策探索のための高レベル意思決定と低レベル個別制御を用いた階層型強化学習手法を提案する。
論文参考訳（メタデータ） (2022-06-25T19:09:29Z)
Coach-assisted Multi-Agent Reinforcement Learning Framework for Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。本稿では,教師支援型多エージェント強化学習フレームワークを提案する。私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文参考訳（メタデータ） (2022-03-16T08:22:45Z)
Locality Matters: A Scalable Value Decomposition Approach for Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文参考訳（メタデータ） (2021-09-22T10:08:15Z)
Multiagent Deep Reinforcement Learning: Challenges and Directions Towards Human-Like Approaches [0.0]
本稿では,最も一般的なマルチエージェント問題表現とその主な課題について述べる。これらの課題に対処する5つの研究領域を特定します。我々は,マルチエージェント強化学習が成功するためには,これらの課題を学際的アプローチで解決することを提案する。
論文参考訳（メタデータ） (2021-06-29T19:53:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。