論文の概要: Algorithms in Multi-Agent Systems: A Holistic Perspective from
Reinforcement Learning and Game Theory
- arxiv url: http://arxiv.org/abs/2001.06487v3
- Date: Fri, 31 Jan 2020 02:16:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 09:58:38.423490
- Title: Algorithms in Multi-Agent Systems: A Holistic Perspective from
Reinforcement Learning and Game Theory
- Title(参考訳): マルチエージェントシステムにおけるアルゴリズム:強化学習とゲーム理論からの全体論
- Authors: Yunlong Lu and Kai Yan
- Abstract要約: 近年では深い強化学習が顕著な成果を上げている。
最近の研究は、シングルエージェントのシナリオを越えて学習を検討し、マルチエージェントのシナリオを検討しています。
従来のゲーム理論アルゴリズムは、現代的なアルゴリズムと組み合わせた明るいアプリケーションの約束を示し、計算能力を高める。
- 参考スコア(独自算出の注目度): 2.5147566619221515
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Deep reinforcement learning (RL) has achieved outstanding results in recent
years, which has led a dramatic increase in the number of methods and
applications. Recent works are exploring learning beyond single-agent scenarios
and considering multi-agent scenarios. However, they are faced with lots of
challenges and are seeking for help from traditional game-theoretic algorithms,
which, in turn, show bright application promise combined with modern algorithms
and boosting computing power. In this survey, we first introduce basic concepts
and algorithms in single agent RL and multi-agent systems; then, we summarize
the related algorithms from three aspects. Solution concepts from game theory
give inspiration to algorithms which try to evaluate the agents or find better
solutions in multi-agent systems. Fictitious self-play becomes popular and has
a great impact on the algorithm of multi-agent reinforcement learning.
Counterfactual regret minimization is an important tool to solve games with
incomplete information, and has shown great strength when combined with deep
learning.
- Abstract(参考訳): 近年, 深層強化学習 (RL) が目覚ましい成果を上げており, 手法や応用の飛躍的な増加につながっている。
最近の研究は、シングルエージェントのシナリオを超えて学習すること、マルチエージェントのシナリオを検討することである。
しかし、彼らは多くの課題に直面しており、従来のゲーム理論的なアルゴリズムからの助けを求めている。
本稿では,まず1つのエージェントRLとマルチエージェントシステムに基本概念とアルゴリズムを導入し,関連するアルゴリズムを3つの側面から要約する。
ゲーム理論の解の概念はエージェントを評価したり、マルチエージェントシステムでより良い解を見つけようとするアルゴリズムにインスピレーションを与える。
架空の自己遊びが普及し、マルチエージェント強化学習のアルゴリズムに大きな影響を与えている。
反事実的後悔の最小化は、不完全な情報でゲームを解くための重要なツールであり、深層学習と組み合わせることで大きな強みを示している。
関連論文リスト
- Diagnosing and exploiting the computational demands of videos games for
deep reinforcement learning [13.98405611352641]
本稿では,タスクの知覚的および強化的学習要求を測定するツールであるLearning Challenge Diagnosticator (LCD)を紹介する。
我々はLCDを用いて、Procgenベンチマークの新たな課題の分類を発見し、これらの予測が信頼性が高く、アルゴリズム開発を指導できることを示す。
論文 参考訳(メタデータ) (2023-09-22T21:03:33Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - Scaling Laws for Imitation Learning in Single-Agent Games [29.941613597833133]
我々は,モデルとデータサイズを慎重にスケールアップすることで,シングルエージェントゲームにおける模倣学習環境に類似した改善がもたらされるかどうかを検討する。
われわれはまずAtariのさまざまなゲームについて実験を行い、その後NetHackの非常に挑戦的なゲームに焦点を当てた。
IL損失と平均戻り値は計算予算とスムーズに一致し,相関関係が強く,計算最適ILエージェントの訓練には電力法則が適用されることがわかった。
論文 参考訳(メタデータ) (2023-07-18T16:43:03Z) - Efficient Cooperation Strategy Generation in Multi-Agent Video Games via
Hypergraph Neural Network [16.226702761758595]
シングルエージェントビデオゲームにおける深層強化学習のパフォーマンスは驚くべきものだ。
しかし、研究者はマルチエージェント環境でビデオゲームを扱う際にさらに困難を抱えている。
本稿では,エージェントのハイパーグラフ構造に適応し,エージェント間の情報特徴抽出と表現の完全化にハイパーグラフ畳み込みを利用するアクタ・クリティック法に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-07T10:34:40Z) - TiKick: Toward Playing Multi-agent Football Full Games from Single-agent
Demonstrations [31.596018856092513]
Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、学習ベースのAIシステムである。
私たちの知る限りでは、Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、初めての学習ベースのAIシステムだ。
論文 参考訳(メタデータ) (2021-10-09T08:34:58Z) - The Information Geometry of Unsupervised Reinforcement Learning [133.20816939521941]
教師なしスキル発見(英語: Unsupervised skill discovery)とは、報酬関数にアクセスせずに一連のポリシーを学ぶアルゴリズムのクラスである。
教師なしのスキル発見アルゴリズムは、あらゆる報酬関数に最適なスキルを学習しないことを示す。
論文 参考訳(メタデータ) (2021-10-06T13:08:36Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - Forgetful Experience Replay in Hierarchical Reinforcement Learning from
Demonstrations [55.41644538483948]
本稿では,複雑な視覚環境において,エージェントが低品質な実演を行えるようにするためのアプローチの組み合わせを提案する。
提案した目標指向のリプレイバッファ構築により,エージェントはデモにおいて複雑な階層的タスクを解くためのサブゴールを自動的に強調することができる。
私たちのアルゴリズムに基づくこのソリューションは、有名なMineRLコンペティションのすべてのソリューションを破り、エージェントがMinecraft環境でダイヤモンドをマイニングすることを可能にする。
論文 参考訳(メタデータ) (2020-06-17T15:38:40Z) - Non-cooperative Multi-agent Systems with Exploring Agents [10.736626320566707]
マルコフゲームを用いたマルチエージェント動作の規範モデルを開発した。
エージェントが探索するが、最適戦略に近い」モデルに焦点を当てる。
論文 参考訳(メタデータ) (2020-05-25T19:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。