論文の概要: An analysis of Reinforcement Learning applied to Coach task in IEEE Very
Small Size Soccer
- arxiv url: http://arxiv.org/abs/2011.11785v1
- Date: Mon, 23 Nov 2020 23:10:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 01:44:36.695065
- Title: An analysis of Reinforcement Learning applied to Coach task in IEEE Very
Small Size Soccer
- Title(参考訳): ieee超小型サッカーにおけるコーチタスクに適用される強化学習の解析
- Authors: Carlos H. C. Pena, Mateus G. Machado, Mariana S. Barros, Jos\'e D. P.
Silva, Lucas D. Maciel, Tsang Ing Ren, Edna N. S. Barros, Pedro H. M. Braga,
Hansenclever F. Bassani
- Abstract要約: 本稿では、強化学習(RL)に基づくコーチングタスクのエンドツーエンドアプローチを提案する。
シミュレーション環境では、3つの異なるチームに対して2つのRLポリシーをトレーニングしました。
結果はVSSSリーグのトップチームの1つに対して評価された。
- 参考スコア(独自算出の注目度): 2.5400028272658144
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The IEEE Very Small Size Soccer (VSSS) is a robot soccer competition in which
two teams of three small robots play against each other. Traditionally, a
deterministic coach agent will choose the most suitable strategy and formation
for each adversary's strategy. Therefore, the role of a coach is of great
importance to the game. In this sense, this paper proposes an end-to-end
approach for the coaching task based on Reinforcement Learning (RL). The
proposed system processes the information during the simulated matches to learn
an optimal policy that chooses the current formation, depending on the opponent
and game conditions. We trained two RL policies against three different teams
(balanced, offensive, and heavily offensive) in a simulated environment. Our
results were assessed against one of the top teams of the VSSS league, showing
promising results after achieving a win/loss ratio of approximately 2.0.
- Abstract(参考訳): IEEE Very Small Size Soccer (VSSS) は、3つの小さなロボットからなる2つのチームが互いに対戦するロボットサッカー競技である。
伝統的に、決定論的コーチエージェントは、各相手の戦略に最も適した戦略と構成を選択する。
そのため、コーチの役割はゲームにとって非常に重要である。
そこで本稿では,強化学習(rl)に基づくコーチング課題に対するエンドツーエンドアプローチを提案する。
提案システムは,シミュレーションマッチ中の情報を処理し,対戦相手やゲーム条件に応じて,現在の構成を選択する最適なポリシーを学習する。
シミュレーション環境で3つの異なるチーム(バランス、攻撃的、攻撃的)に対して2つのRLポリシをトレーニングしました。
結果はvssリーグの上位チームのうちの1チームに対して評価され、勝利/負け率を約2.0で達成した後、有望な結果が得られた。
関連論文リスト
- A Minimaximalist Approach to Reinforcement Learning from Human Feedback [49.45285664482369]
人間のフィードバックから強化学習を行うアルゴリズムとして,SPO(Self-Play Preference Optimization)を提案する。
我々のアプローチは、報酬モデルや不安定な敵の訓練を必要としないという点で最小主義である。
我々は,一連の継続的制御タスクにおいて,報酬モデルに基づくアプローチよりもはるかに効率的に学習できることを実証した。
論文 参考訳(メタデータ) (2024-01-08T17:55:02Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - How does AI play football? An analysis of RL and real-world football
strategies [2.1628586087680075]
強化学習(RL)により、幅広い応用に優れた高度なエージェントの開発が可能になった。
サッカーRLエージェントのプレイスタイル特性について検討し、トレーニング中に戦略がどのように発展するかを明らかにする。
学習した戦略は、実際のサッカー選手の戦略と比較される。
論文 参考訳(メタデータ) (2021-11-24T08:44:23Z) - Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team
Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。
この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。
1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文 参考訳(メタデータ) (2021-05-18T17:27:37Z) - Learning to Play Soccer From Scratch: Sample-Efficient Emergent
Coordination through Curriculum-Learning and Competition [1.675857332621569]
本研究では,2v2サッカーに適用した複雑なマルチエージェント動作を効率的に学習する手法を提案する。
この問題はマルコフゲームとして定式化され、深層強化学習を用いて解決される。
この結果から, サッカーの高品質なプレーは40M未満のインタラクションで実現できることが示された。
論文 参考訳(メタデータ) (2021-03-09T01:57:16Z) - L2E: Learning to Exploit Your Opponent [66.66334543946672]
本稿では,暗黙的対向モデリングのための新しい学習フレームワークを提案する。
L2Eは、トレーニング中に異なる相手との対話によって、相手を悪用する能力を取得する。
本稿では, 対戦相手を自動的に生成する新しい対戦相手戦略生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-18T14:27:59Z) - A Framework for Studying Reinforcement Learning and Sim-to-Real in Robot
Soccer [1.1785354380793065]
本稿では,ロボットサッカーにおける強化学習(Reinforcement Learning, RL)とsim-to-realを研究するための,VSSS-RLと呼ばれるオープンフレームワークを紹介する。
本研究では,サッカーエージェントの完全な動作を制御するために,連続的あるいは離散的な制御ポリシーを訓練できるシミュレーション環境を提案する。
本研究の結果から,手作り制御政策の実施が困難な行動の幅広いレパートリーを学習したことが示唆された。
論文 参考訳(メタデータ) (2020-08-18T23:52:32Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z) - Learning to Play Soccer by Reinforcement and Applying Sim-to-Real to
Compete in the Real World [1.3114165111679479]
本研究は, IEEE Very Small Size Soccer (VSSS) における実サッカーロボットの完全制御のための強化学習(RL)の適用性を示す。
VSSSリーグでは、3つの小さなロボットの2つのチームが互いに対戦します。
本研究では、連続的または離散的な制御ポリシーを訓練できるシミュレーション環境と、得られたポリシーを用いて現実世界のロボットを制御できるようにするSim-to-Real法を提案する。
論文 参考訳(メタデータ) (2020-03-24T20:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。