論文の概要: Distributed Reinforcement Learning for Cooperative Multi-Robot Object
Manipulation
- arxiv url: http://arxiv.org/abs/2003.09540v1
- Date: Sat, 21 Mar 2020 00:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 13:26:57.031584
- Title: Distributed Reinforcement Learning for Cooperative Multi-Robot Object
Manipulation
- Title(参考訳): 協調型マルチロボット物体操作のための分散強化学習
- Authors: Guohui Ding, Joewie J. Koh, Kelly Merckaert, Bram Vanderborght, Marco
M. Nicotra, Christoffer Heckman, Alessandro Roncone, Lijun Chen
- Abstract要約: 強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討
分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。
本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
- 参考スコア(独自算出の注目度): 53.262360083572005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider solving a cooperative multi-robot object manipulation task using
reinforcement learning (RL). We propose two distributed multi-agent RL
approaches: distributed approximate RL (DA-RL), where each agent applies
Q-learning with individual reward functions; and game-theoretic RL (GT-RL),
where the agents update their Q-values based on the Nash equilibrium of a
bimatrix Q-value game. We validate the proposed approaches in the setting of
cooperative object manipulation with two simulated robot arms. Although we
focus on a small system of two agents in this paper, both DA-RL and GT-RL apply
to general multi-agent systems, and are expected to scale well to large
systems.
- Abstract(参考訳): 強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクについて検討する。
分散近似rl (da-rl) では, 各エージェントが個別の報酬関数をq-ラーニングし, エージェントが二行列のq-値ゲームのnash平衡に基づいてq値を更新するゲーム理論rl (gt-rl) を提案する。
2つの模擬ロボットアームによる協調物体操作の設定における提案手法の有効性を検証する。
本稿では,二つのエージェントの小さなシステムに焦点を当てるが,da-rl と gt-rl は一般のマルチエージェントシステムに適用され,大規模システムへのスケール性が期待できる。
関連論文リスト
- ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL [80.10358123795946]
大規模言語モデルを微調整するためのマルチターンRLアルゴリズムを構築するためのフレームワークを開発する。
我々のフレームワークは階層的なRLアプローチを採用し、2つのRLアルゴリズムを並列に実行している。
実験により,ArCHerはエージェントタスクの効率と性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:45:56Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。
この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。
本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Learning From Good Trajectories in Offline Multi-Agent Reinforcement
Learning [98.07495732562654]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから効果的なマルチエージェントポリシーを学ぶことを目的としている。
オフラインのMARLが学んだエージェントは、しばしばこのランダムなポリシーを継承し、チーム全体のパフォーマンスを脅かす。
この問題に対処するために,共有個人軌道(SIT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-28T18:11:26Z) - Group-Agent Reinforcement Learning [12.915860504511523]
複数の地理的に分散したエージェントがそれぞれのRLタスクを協調的に実行すれば、各エージェントの強化学習プロセスに大きく貢献できる。
グループエージェント強化学習(GARL)のための分散RLフレームワークDDAL(Decentralized Distributed Asynchronous Learning)を提案する。
論文 参考訳(メタデータ) (2022-02-10T16:40:59Z) - Decentralized Cooperative Multi-Agent Reinforcement Learning with
Exploration [35.75029940279768]
マルコフチーム(Markov team)において、最も基本的な協調環境でマルチエージェント強化学習を研究する。
本稿では,各エージェントが独立してステージベースのVラーニングスタイルのアルゴリズムを実行するアルゴリズムを提案する。
エージェントは、少なくとも$proptowidetildeO (1/epsilon4)$ episodesにおいて、$epsilon$-approximate Nash平衡ポリシーを学ぶことができる。
論文 参考訳(メタデータ) (2021-10-12T02:45:12Z) - The Power of Exploiter: Provable Multi-Agent RL in Large State Spaces [36.097537237660234]
そこで本研究では,多くのサンプルを用いてナッシュ均衡政策を立証可能なアルゴリズムを提案する。
新しいアルゴリズムの重要な要素はエクスプローラーであり、彼女の弱点を意図的に活用することで、メインプレイヤーの学習を容易にする。
我々の理論フレームワークは汎用的であり、MG、線形あるいはカーネル関数近似のMG、リッチな観測のMGなど、幅広いモデルに適用できる。
論文 参考訳(メタデータ) (2021-06-07T05:39:09Z) - MALib: A Parallel Framework for Population-based Multi-agent
Reinforcement Learning [61.28547338576706]
人口ベースマルチエージェント強化学習(PB-MARL)は、強化学習(RL)アルゴリズムでネストした一連の手法を指す。
PB-MARLのためのスケーラブルで効率的な計算フレームワークMALibを提案する。
論文 参考訳(メタデータ) (2021-06-05T03:27:08Z) - Scalable Multi-Agent Inverse Reinforcement Learning via
Actor-Attention-Critic [54.2180984002807]
マルチエージェント逆逆強化学習 (MA-AIRL) は, 単エージェントAIRLをマルチエージェント問題に適用する最近の手法である。
本稿では,従来の手法よりもサンプル効率が高く,スケーラブルなマルチエージェント逆RLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-24T20:30:45Z) - Extended Markov Games to Learn Multiple Tasks in Multi-Agent
Reinforcement Learning [7.332887338089177]
我々は、拡張マルコフゲームを、複数のRLエージェントが同時に様々な非マルコフ仕様を学習できる一般的な数学的モデルとして定義する。
具体的には、我々のモデルを用いて、2つの異なる論理ベースのマルチエージェントRLアルゴリズムを訓練し、マルコフ的でないコセーフ仕様の多様な設定を解決する。
論文 参考訳(メタデータ) (2020-02-14T12:37:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。