論文の概要: Estimates for the Branching Factors of Atari Games
- arxiv url: http://arxiv.org/abs/2107.02385v2
- Date: Thu, 8 Jul 2021 05:59:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 10:27:41.723919
- Title: Estimates for the Branching Factors of Atari Games
- Title(参考訳): atariゲームにおける分岐要因の推定
- Authors: Mark J. Nelson
- Abstract要約: 本稿では,Atari 2600ゲーム103の分岐係数を推定する。
ゲームによっては、ALEはゲームプレイのフレームごとに3から18のアクションを公開する。
- 参考スコア(独自算出の注目度): 1.52292571922932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The branching factor of a game is the average number of new states reachable
from a given state. It is a widely used metric in AI research on board games,
but less often computed or discussed for videogames. This paper provides
estimates for the branching factors of 103 Atari 2600 games, as implemented in
the Arcade Learning Environment (ALE). Depending on the game, ALE exposes
between 3 and 18 available actions per frame of gameplay, which is an upper
bound on branching factor. This paper shows, based on an enumeration of the
first 1 million distinct states reachable in each game, that the average
branching factor is usually much lower, in many games barely above 1. In
addition to reporting the branching factors, this paper aims to clarify what
constitutes a distinct state in ALE.
- Abstract(参考訳): ゲームの分岐係数は、与えられた状態から到達可能な新しい状態の平均数である。
ボードゲームにおけるAI研究において広く使われている指標であるが、ビデオゲームで計算や議論されることは少ない。
本稿では,アーケード学習環境(ALE)で実施されている103のAtari 2600ゲームの分岐係数を推定する。
ゲームによっては、ALEはゲームプレイのフレームごとに3から18のアクションを公開する。
本稿では、各ゲームで到達可能な最初の100万個の異なる状態の列挙に基づいて、平均分岐係数が通常より低く、ほとんどのゲームにおいて1よりわずかに多いことを示す。
本稿では,分岐要因の報告に加えて,ALEの異なる状態を構成するものを明らかにすることを目的とする。
関連論文リスト
- Tree Search for Simultaneous Move Games via Equilibrium Approximation [13.89302587642183]
同時移動ゲームのクラスについて検討する。
どちらのエージェントも、相手の動き以外はゲーム状態を知っている。
本研究では,完全な情報設定から自己プレイを通じて学習した木探索アルゴリズムを,パフォーマンスを著しく損なうことなく同時移動ゲームに適応させることができるか?
論文 参考訳(メタデータ) (2024-06-14T21:02:35Z) - Serious Games in Digital Gaming: A Comprehensive Review of Applications,
Game Engines and Advancements [55.2480439325792]
近年,ユーザを同時に教育し,楽しませる能力によって,真剣なゲームの人気が高まっている。
本稿では,様々なタイプのデジタルゲームの概要を概観し,真剣なゲームジャンルに展開する。
ゲーム開発業界で最も広く使われているゲームエンジンを提示し、Unityのゲームマシンの利点を拡張する。
論文 参考訳(メタデータ) (2023-11-03T09:17:09Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Reasoning about Causality in Games [63.930126666879396]
因果推論とゲーム理論推論は人工知能の基本的なトピックである。
本稿では,エージェントの意思決定ルールとゲームを管理する分布の依存関係をエンコードするメカニケードゲームを紹介する。
因果ゲームと他の形式主義の対応を記述し、他の因果ゲームやゲーム理論モデルがサポートしていない問合せにどのように因果ゲームが使えるかを説明する。
論文 参考訳(メタデータ) (2023-01-05T22:47:28Z) - Atari-5: Distilling the Arcade Learning Environment down to Five Games [16.907436111256253]
本稿では,ベンチマークスイート内の環境の小さいが代表的なサブセットを選択するための原則的手法を提案する。
ALEにおける多くのゲーム間で高い相関関係があるため、このレベルの圧縮が可能であることが示される。
論文 参考訳(メタデータ) (2022-10-05T04:41:20Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Spatial State-Action Features for General Games [5.849736173068868]
汎用ゲームのための空間状態対応機能の設計と効率的な実装を定式化する。
これらは、局所的な状態の変数にマッチするかどうかに基づいて、アクションをインセンティブまたは非インセンティブ化するようにトレーニングできるパターンである。
任意の機能セットに対して,アクティブな機能を評価するための効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-17T13:34:04Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Statistical Tree-based Population Seeding for Rolling Horizon EAs in
General Video Game Playing [1.6344394737380061]
転がり地平線機構を用いた進化的アルゴリズム(EA)は,このような問題に対して異常な結果をもたらした。
これらの制限には、人口を作り、それをほんの数秒で進化させる無駄なメカニズムが含まれる。
提案手法は,20種類のゲームにおいて,バニラ型ローリング・ホライゾンEAよりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-30T19:33:19Z) - Model-Based Reinforcement Learning for Atari [89.3039240303797]
エージェントがモデルフリーの手法よりも少ないインタラクションでAtariゲームを解くことができることを示す。
本実験は,エージェントと環境間の100kの相互作用の少ないデータ構造における,AtariゲームにおけるSimPLeの評価である。
論文 参考訳(メタデータ) (2019-03-01T15:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。