論文の概要: Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game
- arxiv url: http://arxiv.org/abs/2004.04000v1
- Date: Wed, 8 Apr 2020 14:11:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:04:24.909687
- Title: Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game
- Title(参考訳): 学習者からの学習: 強化学習エージェントをカードゲームに適応させる
- Authors: Pablo Barros, Ana Tanevska, Alessandra Sciutti
- Abstract要約: 本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
- 参考スコア(独自算出の注目度): 71.24825724518847
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Learning how to adapt to complex and dynamic environments is one of the most
important factors that contribute to our intelligence. Endowing artificial
agents with this ability is not a simple task, particularly in competitive
scenarios. In this paper, we present a broad study on how popular reinforcement
learning algorithms can be adapted and implemented to learn and to play a
real-world implementation of a competitive multiplayer card game. We propose
specific training and validation routines for the learning agents, in order to
evaluate how the agents learn to be competitive and explain how they adapt to
each others' playing style. Finally, we pinpoint how the behavior of each agent
derives from their learning style and create a baseline for future research on
this scenario.
- Abstract(参考訳): 複雑でダイナミックな環境への適応方法を学ぶことは、私たちの知性に貢献する最も重要な要素の1つです。
この能力で人工エージェントを生産することは、特に競争シナリオにおいて単純な作業ではない。
本稿では,強化学習アルゴリズムを学習に応用し,競争型マルチプレイヤーカードゲームの実世界実装に活用し,実装する方法について,幅広い研究を行う。
本研究は,学習者に対して,エージェントが競争的であることの学習方法を評価し,各エージェントが互いの演奏スタイルにどう適応するかを説明するために,特定のトレーニングと検証ルーチンを提案する。
最後に,各エージェントの動作が学習スタイルからどのように導出され,今後の研究のベースラインとなるかを見極める。
関連論文リスト
- Fast Peer Adaptation with Context-aware Exploration [63.08444527039578]
マルチエージェントゲームにおける学習エージェントに対するピア識別報酬を提案する。
この報酬は、効果的な探索と迅速な適応のための文脈認識ポリシーを学ぶためのエージェントのモチベーションとなる。
我々は,競争力のある(クーンポーカー),協力的(PO-Overcooked),あるいは混合的(Predator-Prey-W)な(Pedator-Prey-W)ゲームを含む多種多様なテストベッドについて評価を行った。
論文 参考訳(メタデータ) (2024-02-04T13:02:27Z) - Curriculum Learning for Cooperation in Multi-Agent Reinforcement
Learning [7.336421550829047]
競争環境では、ますます熟練した相手のカリキュラムと競合させることで、学習エージェントを訓練することができる。
一般的な知的エージェントは、他のエージェントに対して行動することを学び、共通の目標を達成するために彼らと協力することもできます。
本稿では,この2つの目的を達成するために,チームメイトとチームメイトとの連携に関する質問に答えることを目的としている。
論文 参考訳(メタデータ) (2023-12-19T00:59:16Z) - Peer Learning: Learning Complex Policies in Groups from Scratch via Action Recommendations [16.073203911932872]
ピアラーニングは、グループで学ぶエージェントのための新しい高度な強化学習フレームワークである。
ピアラーニングは,OpenAI Gymドメインのいくつかの課題において,単一エージェント学習とベースラインを上回り得ることを示す。
論文 参考訳(メタデータ) (2023-12-15T17:01:35Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Learning to Play Text-based Adventure Games with Maximum Entropy
Reinforcement Learning [4.698846136465861]
我々はテキストベースの環境にソフト・アクター・クリティック(SAC)アルゴリズムを適用する。
報酬形成技術は、エージェントがポリシーをより早く学習し、より高いスコアを得るのに役立つことを示す。
論文 参考訳(メタデータ) (2023-02-21T15:16:12Z) - Conditional Imitation Learning for Multi-Agent Games [89.897635970366]
本研究では,条件付きマルチエージェント模倣学習の課題について考察する。
本稿では,スケーラビリティとデータ不足の難しさに対処する新しい手法を提案する。
我々のモデルは,egoやパートナエージェント戦略よりも低ランクなサブスペースを学習し,サブスペースに補間することで,新たなパートナ戦略を推論し,適応する。
論文 参考訳(メタデータ) (2022-01-05T04:40:13Z) - Policy Fusion for Adaptive and Customizable Reinforcement Learning
Agents [137.86426963572214]
異なる行動政策を結合して有意義な「融合」政策を得る方法を示す。
事前学習されたポリシーを組み合わせるための4つの異なるポリシー融合手法を提案する。
これらの手法がゲーム制作や設計に実際どのように役立つのか,実例とユースケースをいくつか紹介する。
論文 参考訳(メタデータ) (2021-04-21T16:08:44Z) - Learning Monopoly Gameplay: A Hybrid Model-Free Deep Reinforcement
Learning and Imitation Learning Approach [31.066718635447746]
強化学習(RL)は、環境と相互作用するエージェントに依存し、それによって受け取った報酬の累積合計を最大化します。
マルチプレイヤーのモノポリーゲームでは、プレイヤーは取引など複雑なアクションを含む毎ターンに複数の決定をしなければならない。
本稿では,モノポリーの勝利戦略を再生および学習できるハイブリッドモデルフリーディープRL(DRL)アプローチについて紹介する。
論文 参考訳(メタデータ) (2021-03-01T01:40:02Z) - Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てる。
本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人的視点から変えられるかを検討することを目的とする。
論文 参考訳(メタデータ) (2020-11-02T21:54:18Z) - Natural Emergence of Heterogeneous Strategies in Artificially
Intelligent Competitive Teams [0.0]
我々はFortAttackと呼ばれる競合するマルチエージェント環境を開発し、2つのチームが互いに競合する。
このような振る舞いがチームの成功に繋がる場合、同種エージェント間の異種行動の自然発生を観察する。
我々は、進化した反対戦略を利用して、友好的なエージェントのための単一のポリシーを訓練するアンサンブルトレーニングを提案する。
論文 参考訳(メタデータ) (2020-07-06T22:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。