論文の概要: Rethinking of AlphaStar
- arxiv url: http://arxiv.org/abs/2108.03452v1
- Date: Sat, 7 Aug 2021 13:55:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:36:22.018318
- Title: Rethinking of AlphaStar
- Title(参考訳): AlphaStarの再考
- Authors: Ruo-Ze Liu
- Abstract要約: ゲーム『StarCraft II』のグランドマスターレベルを達成するプログラムであるAlphaStar(AS)について異なる視点を示す。
我々はASに問題を提示し、そのうちのいくつかはその欠陥であり、その一部は記事の中で無視されている重要な詳細である。
- 参考スコア(独自算出の注目度): 0.9137554315375922
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a different view for AlphaStar (AS), the program achieving
Grand-Master level in the game StarCraft II. It is considered big progress for
AI research. However, in this paper, we present problems with the AS, some of
which are the defects of it, and some of which are important details that are
neglected in its article. These problems arise two questions. One is that what
can we get from the built of AS? The other is that does the battle between it
with humans fair? After the discussion, we present the future research
directions for these problems. Our study is based on a reproduction code of the
AS, and the codes are available online.
- Abstract(参考訳): ゲーム『StarCraft II』のグランドマスターレベルを達成するプログラムであるAlphaStar(AS)について異なる視点を示す。
AI研究の大きな進歩と見なされている。
しかし,本論文では,ASの問題点について述べるとともに,その欠点と,その論文で無視されている重要な詳細について述べる。
これらの問題は2つの問題を引き起こす。
ひとつは、ASの構築から何が得られますか?
もう1つは 人間との戦いは 公平なのか?
議論の後、これらの問題の今後の研究方向について述べる。
本研究は,asの再現コードに基づいており,そのコードはオンラインで利用可能である。
関連論文リスト
- Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文 参考訳(メタデータ) (2024-10-10T17:38:38Z) - SUPER: Evaluating Agents on Setting Up and Executing Tasks from Research Repositories [55.161075901665946]
Superは、機械学習(ML)と自然言語処理(NLP)の研究リポジトリを扱う研究者が直面する現実的な課題を捉えることを目的としている。
本ベンチマークでは,注釈付きエキスパートソリューションを用いたエンドツーエンド問題45,特定の課題に焦点をあてたエキスパートソリューションから導いた152,大規模開発のための602の問題を自動生成する。
我々は、最先端のアプローチが、最良のモデル(GPT-4o)でこれらの問題を解決するのに苦労していることを示し、エンド・ツー・エンドの16.3%と46.1%のシナリオを解決した。
論文 参考訳(メタデータ) (2024-09-11T17:37:48Z) - Responsible AI (RAI) Games and Ensembles [30.110052769733247]
本稿では,Responsible AI(RAI)ゲーム(Responsible AI)と呼ばれる問題を研究するための一般的なフレームワークを提供する。
a)ゲームプレイベースアルゴリズムと(b)ステージワイズ推定アルゴリズムの2つのクラスを提供する。
我々は、いくつかのRAI問題、特にサブポピュレーションシフトに関して、我々の技術の適用性と競争性能を実証的に実証した。
論文 参考訳(メタデータ) (2023-10-28T22:17:30Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - On Efficient Reinforcement Learning for Full-length Game of StarCraft II [21.768578136029987]
本稿では,抽出されたマクロアクションとニューラルネットワークの階層構造を含む階層的RL手法について検討する。
64x64マップと制限単位を用いて、レベル1組込みAIに対して99%の勝利率を達成する。
我々は、エージェントを不正なレベルAIに対して訓練し、レベル8、レベル9、レベル10のAIに対してそれぞれ96%、97%、94%の勝利率を達成するために、アーキテクチャを改善した。
論文 参考訳(メタデータ) (2022-09-23T12:24:21Z) - An AlphaZero-Inspired Approach to Solving Search Problems [63.24965775030674]
探索問題を解くためにAlphaZeroで使用される手法と手法を適応する。
本稿では,簡単な解法と自己還元という観点から表現できる可能性について述べる。
また,探索問題に適応したモンテカルロ木探索法についても述べる。
論文 参考訳(メタデータ) (2022-07-02T23:39:45Z) - The MineRL BASALT Competition on Learning from Human Feedback [58.17897225617566]
MineRL BASALTコンペティションは、この重要な種類の技術の研究を促進することを目的としている。
Minecraftでは、ハードコードされた報酬関数を書くのが難しいと期待する4つのタスクのスイートを設計しています。
これら4つのタスクのそれぞれについて、人間のデモのデータセットを提供するとともに、模擬学習ベースラインを提供する。
論文 参考訳(メタデータ) (2021-07-05T12:18:17Z) - An Introduction of mini-AlphaStar [22.820438931820764]
AlphaStarと呼ばれるSC2エージェントは優れた性能を示し、グランドマスターレベルの人間選手に対して99.8%の勝利率を得る。
論文と擬似コードに基づいてミニアルファスターと呼ばれるミニスケール版を実装した。
mini-AlphaStarの目的は、オリジナルのAlphaStarの複製を提供し、大規模な問題に関するRLの将来の研究を促進することです。
論文 参考訳(メタデータ) (2021-04-14T14:31:51Z) - OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game
Research [82.09426894653237]
OpenHoldemは、NLTHを用いた大規模不完全情報ゲーム研究のための統合ツールキットです。
1)異なるNLTH AIを徹底的に評価するための標準化された評価プロトコル、2)NLTH AIのための3つの公的に利用可能な強力なベースライン、3)公開NLTH AI評価のための使いやすいAPIを備えたオンラインテストプラットフォーム。
論文 参考訳(メタデータ) (2020-12-11T07:24:08Z) - TStarBot-X: An Open-Sourced and Comprehensive Study for Efficient League
Training in StarCraft II Full Game [25.248034258354533]
最近、GoogleのDeepMindは、StarCraft IIのグランドマスターレベルのAIであるAlphaStarを発表した。
本稿では,TStarBot-XというAIエージェントを導入する。このエージェントはより少ない計算量で訓練され,熟練した人間プレイヤーと競争できる。
論文 参考訳(メタデータ) (2020-11-27T13:31:49Z) - From Chess and Atari to StarCraft and Beyond: How Game AI is Driving the
World of AI [10.80914659291096]
Game AIは、最も先進的なAIアルゴリズムを開発し、テストするための研究分野として、自らを確立した。
Game AIの進歩は、ロボティクスや化学物質の合成など、ゲーム以外の領域にも拡張され始めている。
論文 参考訳(メタデータ) (2020-02-24T18:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。