論文の概要: Deep Q-Network for AI Soccer
- arxiv url: http://arxiv.org/abs/2209.09491v2
- Date: Wed, 21 Sep 2022 05:26:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 12:34:16.578724
- Title: Deep Q-Network for AI Soccer
- Title(参考訳): AIサッカーのためのディープQネットワーク
- Authors: Curie Kim, Yewon Hwang, and Jong-Hwan Kim
- Abstract要約: Deep Q-Networkは、元の報酬、状態空間、各エージェントをトレーニングするためのアクションスペースを実装するように設計されています。
我々のアルゴリズムはエージェントの訓練に成功し、その性能はミニコンペティションによって実証された。
このアルゴリズムにより、39カ国130チームとの国際競争で16ラウンドに進出した。
- 参考スコア(独自算出の注目度): 6.417982603606359
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning has shown an outstanding performance in the
applications of games, particularly in Atari games as well as Go. Based on
these successful examples, we attempt to apply one of the well-known
reinforcement learning algorithms, Deep Q-Network, to the AI Soccer game. AI
Soccer is a 5:5 robot soccer game where each participant develops an algorithm
that controls five robots in a team to defeat the opponent participant. Deep
Q-Network is designed to implement our original rewards, the state space, and
the action space to train each agent so that it can take proper actions in
different situations during the game. Our algorithm was able to successfully
train the agents, and its performance was preliminarily proven through the
mini-competition against 10 teams wishing to take part in the AI Soccer
international competition. The competition was organized by the AI World Cup
committee, in conjunction with the WCG 2019 Xi'an AI Masters. With our
algorithm, we got the achievement of advancing to the round of 16 in this
international competition with 130 teams from 39 countries.
- Abstract(参考訳): 強化学習は、ゲーム、特にatariゲームやgoの応用において、優れたパフォーマンスを示している。
これらの成功例に基づき、AIサッカーゲームによく知られた強化学習アルゴリズムであるディープQネットワークを適用しようとする。
ai soccerは5:5のロボットサッカーゲームで、各参加者は対戦相手を倒すためにチーム内の5つのロボットを制御するアルゴリズムを開発した。
Deep Q-Networkは、元の報酬、状態空間、アクションスペースを実装して、各エージェントをトレーニングすることで、ゲーム中に異なる状況で適切なアクションをすることができるように設計されています。
我々のアルゴリズムはエージェントの訓練に成功し、AIサッカー国際大会に参加を希望する10チームに対するミニコンペティションを通じて、そのパフォーマンスが実証された。
この大会は、WCG 2019 Xi'an AI Mastersと共に、AIワールドカップ委員会によって組織された。
私たちのアルゴリズムでは、39カ国の130チームと、この国際コンペティションで16のラウンドに進むという成果を得ました。
関連論文リスト
- Brilla AI: AI Contestant for the National Science and Maths Quiz [0.7329200485567825]
この研究はNSMQ AI Grand Challengeの最初の重要な成果を記述し、評価する。
AIを構築することで、ガーナのNational Science and Maths Quiz(NSMQ)コンペティションに出場し、勝利する"。
デビューで、私たちのAIは3つの人間コンテストチームの前の4つの謎のうちの1つに答えました。
論文 参考訳(メタデータ) (2024-03-04T03:24:18Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - Teamwork under extreme uncertainty: AI for Pokemon ranks 33rd in the
world [0.0]
本稿では,ゲームのメカニズムを解説し,ゲーム解析を行う。
ゲームにおける2つの最大の課題は、バランスのとれたチームを維持し、不確実性の3つの源に対処することだ、という認識に基づいて、ユニークなAIアルゴリズムを提案する。
我々のAIエージェントは、これまでのすべての試みよりも大幅に向上し、世界で最も人気のある戦闘フォーマットの1つで、世界で33位まで上昇しました。
論文 参考訳(メタデータ) (2022-12-27T01:52:52Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - Retrospective on the 2021 BASALT Competition on Learning from Human
Feedback [92.37243979045817]
競争の目的は、人間のフィードバック(LfHF)技術から学び、オープンワールドの課題を解決するエージェントへの研究を促進することであった。
LfHF技術の使用を義務付けるのではなく、ビデオゲームMinecraftで達成すべき自然言語の4つのタスクについて説明した。
チームは、様々な可能な人間のフィードバックタイプにまたがる多様なLfHFアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-04-14T17:24:54Z) - AI in Games: Techniques, Challenges and Opportunities [40.86375378643978]
Libratus、OpenAI Five、AlphaStarといった様々なゲームAIシステムが開発され、プロの人間プレイヤーに勝っている。
本稿では,最近成功したゲームAI,ボードゲームAI,カードゲームAI,ファーストパーソンシューティングゲームAI,リアルタイム戦略ゲームAIについて調査する。
論文 参考訳(メタデータ) (2021-11-15T09:35:53Z) - Snakes AI Competition 2020 and 2021 Report [65.7695644335859]
スネークスAIコンペティションはインノポリス大学が主催した。
IEEE Conference on Games 2020と2021エディションの一部だった。
エージェントに人工知能アルゴリズムを学習し、実装するためのサンドボックスを作成することを目的としていた。
論文 参考訳(メタデータ) (2021-08-11T10:27:11Z) - A Game AI Competition to foster Collaborative AI research and
development [5.682875185620577]
我々はGeometry Friends Game AIコンペティションを開催する。
ゲームの概念は単純だが、その解決は難しいことが証明されている。
コンペティションとそれがもたらす課題について議論し、現在のソリューションの概要を示す。
論文 参考訳(メタデータ) (2020-10-17T23:03:06Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。