論文の概要: Teamwork under extreme uncertainty: AI for Pokemon ranks 33rd in the
world
- arxiv url: http://arxiv.org/abs/2212.13338v1
- Date: Tue, 27 Dec 2022 01:52:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 15:55:39.616038
- Title: Teamwork under extreme uncertainty: AI for Pokemon ranks 33rd in the
world
- Title(参考訳): 極端に不確実なチームワーク:ポケモンのためのAIは世界33位
- Authors: Nicholas R. Sarantinos
- Abstract要約: 本稿では,ゲームのメカニズムを解説し,ゲーム解析を行う。
ゲームにおける2つの最大の課題は、バランスのとれたチームを維持し、不確実性の3つの源に対処することだ、という認識に基づいて、ユニークなAIアルゴリズムを提案する。
我々のAIエージェントは、これまでのすべての試みよりも大幅に向上し、世界で最も人気のある戦闘フォーマットの1つで、世界で33位まで上昇しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The highest grossing media franchise of all times, with over \$90 billion in
total revenue, is Pokemon. The video games belong to the class of Japanese Role
Playing Games (J-RPG). Developing a powerful AI agent for these games is very
hard because they present big challenges to MinMax, Monte Carlo Tree Search and
statistical Machine Learning, as they are vastly different from the well
explored in AI literature games. An AI agent for one of these games means
significant progress in AI agents for the entire class. Further, the key
principles of such work can hopefully inspire approaches to several domains
that require excellent teamwork under conditions of extreme uncertainty,
including managing a team of doctors, robots or employees in an ever changing
environment, like a pandemic stricken region or a war-zone. In this paper we
first explain the mechanics of the game and we perform a game analysis. We
continue by proposing unique AI algorithms based on our understanding that the
two biggest challenges in the game are keeping a balanced team and dealing with
three sources of uncertainty. Later on, we describe why evaluating the
performance of such agents is challenging and we present the results of our
approach. Our AI agent performed significantly better than all previous
attempts and peaked at the 33rd place in the world, in one of the most popular
battle formats, while running on only 4 single socket servers.
- Abstract(参考訳): 史上最高額のメディア・フランチャイズで、総売上は9000億ドルを超えているのがポケモンだ。
ゲームは日本ロールプレイングゲーム(J-RPG)のクラスに属する。
これらのゲームのための強力なAIエージェントの開発は、MinMax、Monte Carlo Tree Search、統計機械学習に大きな課題をもたらすため、非常に難しい。
これらのゲームの1つのAIエージェントは、クラス全体のAIエージェントの大幅な進歩を意味する。
さらに、このような作業の重要な原則は、パンデミックや戦争ゾーンのような変化の激しい環境の中で、医師、ロボット、従業員のチームを管理することを含む、極端な不確実性の条件下で優れたチームワークを必要とするいくつかのドメインへのアプローチを刺激することができる。
本稿では,まずゲームの仕組みを説明し,ゲーム解析を行う。
ゲームにおける2つの最大の課題は、バランスの取れたチームを維持し、3つの不確実性源を扱うことだ、という理解に基づいて、ユニークなaiアルゴリズムを提案し続けます。
その後,このようなエージェントの性能評価が難しい理由を説明し,提案手法の結果を紹介する。
私たちのaiエージェントは、これまでのすべての試みよりもはるかに優れており、世界で最も人気のあるバトルフォーマットの1つで、世界で33位でピークに達しました。
関連論文リスト
- Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.618236610219554]
戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。
従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。
その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文 参考訳(メタデータ) (2024-06-12T08:06:31Z) - Toward Human-AI Alignment in Large-Scale Multi-Player Games [24.784173202415687]
我々はXboxのBleeding Edge(100K+ゲーム)から広範囲にわたる人間のゲームプレイデータを解析する。
人間のプレイヤーは、戦闘飛行や探索飛行行動において多様性を示す一方で、AIプレイヤーは均一性に向かう傾向にある。
これらの大きな違いは、ヒューマンアラインアプリケーションにおけるAIの解釈可能な評価、設計、統合の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-02-05T22:55:33Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - Diversifying AI: Towards Creative Chess with AlphaZero [22.169342583475938]
多様なAIシステムからなるチームが、グループとしてより多くのアイデアを生成し、最適なAIを選択することで、困難なタスクにおいて1つのAIより優れているかどうかを調査する。
我々の実験は、AZ_dbが様々な方法でチェスをし、グループとしてより多くのパズルを解き、より均質なチームを上回ることを示唆している。
我々の研究結果は、AIエージェントのチームでは、人間のチームと同じように多様性のボーナスが現れることを示唆している。
論文 参考訳(メタデータ) (2023-08-17T20:27:33Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - AI in Games: Techniques, Challenges and Opportunities [40.86375378643978]
Libratus、OpenAI Five、AlphaStarといった様々なゲームAIシステムが開発され、プロの人間プレイヤーに勝っている。
本稿では,最近成功したゲームAI,ボードゲームAI,カードゲームAI,ファーストパーソンシューティングゲームAI,リアルタイム戦略ゲームAIについて調査する。
論文 参考訳(メタデータ) (2021-11-15T09:35:53Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z) - From Chess and Atari to StarCraft and Beyond: How Game AI is Driving the
World of AI [10.80914659291096]
Game AIは、最も先進的なAIアルゴリズムを開発し、テストするための研究分野として、自らを確立した。
Game AIの進歩は、ロボティクスや化学物質の合成など、ゲーム以外の領域にも拡張され始めている。
論文 参考訳(メタデータ) (2020-02-24T18:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。