論文の概要: Meta Arcade: A Configurable Environment Suite for Meta-Learning
- arxiv url: http://arxiv.org/abs/2112.00583v1
- Date: Wed, 1 Dec 2021 15:54:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 15:31:00.120570
- Title: Meta Arcade: A Configurable Environment Suite for Meta-Learning
- Title(参考訳): Meta Arcade: メタ学習のための構成可能な環境スイート
- Authors: Edward W. Staley, Chace Ashcraft, Benjamin Stoler, Jared Markowitz,
Gautam Vallabha, Christopher Ratto, Kapil D. Katyal
- Abstract要約: 本稿では,共通の視覚,状態空間,アクション空間,ゲームコンポーネント,スコアリング機構などを共有する,カスタム2Dアーケードゲームを容易に定義および設定するツールであるMeta Arcadeを紹介する。
このフレームワークの可能性を総合的に説明した24の事前定義されたゲーム群を含み、これらのゲームがどのように研究アプリケーションに設定できるかについて議論する。
- 参考スコア(独自算出の注目度): 4.962850553353402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most approaches to deep reinforcement learning (DRL) attempt to solve a
single task at a time. As a result, most existing research benchmarks consist
of individual games or suites of games that have common interfaces but little
overlap in their perceptual features, objectives, or reward structures. To
facilitate research into knowledge transfer among trained agents (e.g. via
multi-task and meta-learning), more environment suites that provide
configurable tasks with enough commonality to be studied collectively are
needed. In this paper we present Meta Arcade, a tool to easily define and
configure custom 2D arcade games that share common visuals, state spaces,
action spaces, game components, and scoring mechanisms. Meta Arcade differs
from prior environments in that both task commonality and configurability are
prioritized: entire sets of games can be constructed from common elements, and
these elements are adjustable through exposed parameters. We include a suite of
24 predefined games that collectively illustrate the possibilities of this
framework and discuss how these games can be configured for research
applications. We provide several experiments that illustrate how Meta Arcade
could be used, including single-task benchmarks of predefined games, sample
curriculum-based approaches that change game parameters over a set schedule,
and an exploration of transfer learning between games.
- Abstract(参考訳): 深層強化学習(DRL)へのほとんどのアプローチは、一度に1つのタスクを解決しようとする。
その結果、既存の研究ベンチマークのほとんどは、共通のインターフェースを持つ個々のゲームまたはゲームスイートで構成され、知覚的特徴、目的、報酬構造にほとんど重複しない。
訓練されたエージェント(例えばマルチタスクやメタラーニング)間の知識伝達の研究を容易にするためには、構成可能なタスクを集合的に研究するのに十分な共通性を備えた環境スイートが必要である。
本稿では,共通の視覚,状態空間,アクションスペース,ゲームコンポーネント,スコアリング機構を共有するカスタム2dアーケードゲームを定義し,構成するツールであるmeta arcadeを提案する。
meta arcadeは、タスクの共通性と構成可能性の両方が優先されるという点で、以前の環境と異なる。
このフレームワークの可能性を総合的に説明し、研究アプリケーション向けにこれらのゲームをどのように構成できるかを議論する24の事前定義されたゲームスイートを含む。
本稿では,事前に定義されたゲームのシングルタスクベンチマーク,ゲームパラメータをセットスケジュールで変更するカリキュラムベースのアプローチ,ゲーム間の移動学習の探索など,Meta Arcadeの活用方法を示す実験をいくつか提供する。
関連論文リスト
- Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with
Subgame Curriculum Learning [65.36326734799587]
ゼロサムゲームのための新しいサブゲームカリキュラム学習フレームワークを提案する。
エージェントを以前に訪れた状態にリセットすることで、適応的な初期状態分布を採用する。
我々は,2乗距離をNE値に近似するサブゲーム選択指標を導出する。
論文 参考訳(メタデータ) (2023-10-07T13:09:37Z) - Towards General Game Representations: Decomposing Games Pixels into
Content and Style [2.570570340104555]
ゲームのピクセル表現を学習することは、複数の下流タスクにまたがる人工知能の恩恵を受けることができる。
本稿では,コンピュータビジョンエンコーダの汎用化について検討する。
我々は、ゲームジャンルに基づく事前学習されたビジョントランスフォーマーエンコーダと分解技術を用いて、個別のコンテンツとスタイルの埋め込みを得る。
論文 参考訳(メタデータ) (2023-07-20T17:53:04Z) - SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。
実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。
我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文 参考訳(メタデータ) (2023-05-24T18:14:35Z) - WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments [5.020816812380825]
深部強化学習(RL)の最近の進歩は,シミュレーション環境における複雑な意思決定能力を示している。
しかしながら、これらは、トレーニングやテストが行われる環境の複雑さやバリエーションが欠如しているため、より複雑な問題はほとんどありません。
我々は,このギャップを埋めるために,3次元オープンワールドFPSゲームに基づく,強力でオープンな環境であるWILD-SCAVを開発した。
エージェントは3D環境を理解し、ナビゲートし、計画し、人間のような方法で競争し、協力することができる。
論文 参考訳(メタデータ) (2022-10-14T13:39:41Z) - Spatial State-Action Features for General Games [5.849736173068868]
汎用ゲームのための空間状態対応機能の設計と効率的な実装を定式化する。
これらは、局所的な状態の変数にマッチするかどうかに基づいて、アクションをインセンティブまたは非インセンティブ化するようにトレーニングできるパターンである。
任意の機能セットに対して,アクティブな機能を評価するための効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-17T13:34:04Z) - Combining Off and On-Policy Training in Model-Based Reinforcement
Learning [77.34726150561087]
MuZeroのシミュレートゲームから得られたデータを用いて、オフポリシターゲットの取得方法を提案する。
以上の結果から,これらの目標がトレーニングプロセスのスピードアップと,より高速な収束とより高い報酬につながることが示唆された。
論文 参考訳(メタデータ) (2021-02-24T10:47:26Z) - Griddly: A platform for AI research in games [0.0]
我々はGriddlyをゲームAI研究の新しいプラットフォームとして紹介する。
Griddlyは、高度にカスタマイズ可能なゲーム、異なるオブザーバタイプ、効率的なC++コアエンジンのユニークな組み合わせを提供する。
本稿では,RLエージェントの観察構成と一般化能力の相違について,一連の基礎実験を行った。
論文 参考訳(メタデータ) (2020-11-12T13:23:31Z) - Learning to Simulate Dynamic Environments with GameGAN [109.25308647431952]
本稿では,エージェントが環境と対話するのを見ることでシミュレーターを学習することを目的とする。
ゲームGANは,学習中にスクリーンプレイやキーボード操作を取り入れることで,所望のゲームを視覚的に模倣することを学習する生成モデルである。
論文 参考訳(メタデータ) (2020-05-25T14:10:17Z) - Navigating the Landscape of Multiplayer Games [20.483315340460127]
大規模ゲームの応答グラフにネットワーク測度を適用することで,ゲームのランドスケープを創出できることを示す。
本研究は, 標準ゲームから複雑な経験ゲームまで, 訓練されたエージェント同士のパフォーマンスを計測する領域における知見について述べる。
論文 参考訳(メタデータ) (2020-05-04T16:58:17Z) - MTL-NAS: Task-Agnostic Neural Architecture Search towards
General-Purpose Multi-Task Learning [71.90902837008278]
汎用マルチタスク学習(GP-MTL)にニューラルアーキテクチャサーチ(NAS)を導入することを提案する。
異なるタスクの組み合わせに対応するため、GP-MTLネットワークを単一タスクのバックボーンに分割する。
また,探索されたアーキテクチャ間の性能ギャップを埋める単一ショット勾配に基づく探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T09:49:14Z) - Exploration Based Language Learning for Text-Based Games [72.30525050367216]
本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
論文 参考訳(メタデータ) (2020-01-24T03:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。