Fugu-MT 論文翻訳(概要): Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning

論文の概要: Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning

arxiv url: http://arxiv.org/abs/2311.00865v1
Date: Wed, 1 Nov 2023 21:35:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-03 15:27:54.575985
Title: Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning
Title（参考訳）: 選択的共有体験はマルチエージェント強化学習を改善する
Authors: Matthias Gerstgrasser, Tom Danino, Sarah Keren
Abstract要約: エージェントは他のエージェントと、トレーニング中に観察される遷移の限られた数で共有する、新しいマルチエージェントRLアプローチを提案する。提案手法は,ベースラインの非共有型分散トレーニングと最先端のマルチエージェントRLアルゴリズムより優れていることを示す。
参考スコア（独自算出の注目度）: 10.39671721972528
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a novel multi-agent RL approach, Selective Multi-Agent Prioritized Experience Relay, in which agents share with other agents a limited number of transitions they observe during training. The intuition behind this is that even a small number of relevant experiences from other agents could help each agent learn. Unlike many other multi-agent RL algorithms, this approach allows for largely decentralized training, requiring only a limited communication channel between agents. We show that our approach outperforms baseline no-sharing decentralized training and state-of-the art multi-agent RL algorithms. Further, sharing only a small number of highly relevant experiences outperforms sharing all experiences between agents, and the performance uplift from selective experience sharing is robust across a range of hyperparameters and DQN variants. A reference implementation of our algorithm is available at https://github.com/mgerstgrasser/super.
Abstract（参考訳）: エージェントを他のエージェントと共有し、トレーニング中に観察する遷移を限定的に行う、新しいマルチエージェントRL手法であるSelective Multi-Agent Prioritized Experience Relayを提案する。この背景にある直感は、他のエージェントからの少数の関連する経験でさえ、各エージェントが学習するのに役立ちます。他の多くのマルチエージェントRLアルゴリズムとは異なり、このアプローチはエージェント間の限られた通信チャネルのみを必要とする、主に分散トレーニングを可能にする。提案手法は,非共有型分散トレーニングと最先端のマルチエージェントRLアルゴリズムより優れていることを示す。さらに、エージェント間のすべての経験を共有することよりも、非常に関係性の高い経験の共有の方が優れており、選択された経験の共有によるパフォーマンス向上は、さまざまなハイパーパラメータとdqnのバリエーションにわたって堅牢である。アルゴリズムのリファレンス実装はhttps://github.com/mgerstgrasser/super.comで利用可能です。

関連論文リスト

Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning [112.16686518063456]
textbfMulti-Agent Test-Time Reinforcement Learning (MATTRL)を導入する。 MATTRLは、マルチターンの議論、テストタイムの経験の検索と統合、最終的な意思決定のコンセンサスに到達するための、複数の専門家のチームを形成する。 MATTRLは、医学、数学、教育の挑戦的なベンチマーク全体にわたって、マルチエージェントベースラインで平均3.67%、同等のシングルエージェントベースラインで平均8.67%の精度を向上する。
論文参考訳（メタデータ） (2026-01-14T17:57:43Z)
Selective Experience Sharing in Reinforcement Learning Enhances Interference Management [6.071146161035648]
細胞間干渉軽減のためのマルチエージェント強化学習手法を提案する。エージェントは他のエージェントと自分の経験を選択的に共有する。提案アルゴリズムは,全ての経験を共有するアルゴリズムによって得られるスペクトル効率の98%を達成する。
論文参考訳（メタデータ） (2025-01-27T02:18:58Z)
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳（メタデータ） (2024-11-06T10:35:11Z)
Learning Emergence of Interaction Patterns across Independent RL Agents in Multi-Agent Environments [3.0284592792243794]
ボトムアップネットワーク(BUN)は、マルチエージェントの集合を統一エンティティとして扱う。協調ナビゲーションやトラヒックコントロールなどのタスクを含む,さまざまな協調型マルチエージェントシナリオに対する実証的な評価は,BUNが計算コストを大幅に削減したベースライン手法よりも優れていることを一貫して証明している。
論文参考訳（メタデータ） (2024-10-03T14:25:02Z)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文参考訳（メタデータ） (2023-05-27T02:14:09Z)
Learning From Good Trajectories in Offline Multi-Agent Reinforcement Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2022-11-28T18:11:26Z)
Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文参考訳（メタデータ） (2022-10-07T00:40:59Z)
Group-Agent Reinforcement Learning [12.915860504511523]
複数の地理的に分散したエージェントがそれぞれのRLタスクを協調的に実行すれば、各エージェントの強化学習プロセスに大きく貢献できる。グループエージェント強化学習(GARL)のための分散RLフレームワークDDAL(Decentralized Distributed Asynchronous Learning)を提案する。
論文参考訳（メタデータ） (2022-02-10T16:40:59Z)
Celebrating Diversity in Shared Multi-Agent Reinforcement Learning [20.901606233349177]
深層多エージェント強化学習は、複雑な協調的な課題を解決することを約束している。本稿では,共有型マルチエージェント強化学習の最適化と表現に多様性を導入することを目的とする。提案手法は,Google Research Footballと超硬度StarCraft IIマイクロマネジメントタスクにおける最先端性能を実現する。
論文参考訳（メタデータ） (2021-06-04T00:55:03Z)
Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文参考訳（メタデータ） (2020-06-10T20:12:38Z)
Scalable Multi-Agent Inverse Reinforcement Learning via Actor-Attention-Critic [54.2180984002807]
マルチエージェント逆逆強化学習 (MA-AIRL) は, 単エージェントAIRLをマルチエージェント問題に適用する最近の手法である。本稿では,従来の手法よりもサンプル効率が高く,スケーラブルなマルチエージェント逆RLアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-02-24T20:30:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。