論文の概要: Using Fractal Neural Networks to Play SimCity 1 and Conway's Game of
Life at Variable Scales
- arxiv url: http://arxiv.org/abs/2002.03896v1
- Date: Wed, 29 Jan 2020 19:10:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 20:53:47.572553
- Title: Using Fractal Neural Networks to Play SimCity 1 and Conway's Game of
Life at Variable Scales
- Title(参考訳): フラクタルニューラルネットワークを用いたsimcity 1とconway's game of lifeの可変スケールでのプレイ
- Authors: Sam Earle
- Abstract要約: Gym-cityは、SimCity 1のゲームエンジンを使って都市環境をシミュレートする強化学習環境である。
我々は、人口に着目し、訓練中に見られたものよりも大きな地図サイズに一般化するエージェントの能力を分析する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce gym-city, a Reinforcement Learning environment that uses SimCity
1's game engine to simulate an urban environment, wherein agents might seek to
optimize one or a combination of any number of city-wide metrics, on gameboards
of various sizes. We focus on population, and analyze our agents' ability to
generalize to larger map-sizes than those seen during training. The environment
is interactive, allowing a human player to build alongside agents during
training and inference, potentially influencing the course of their learning,
or manually probing and evaluating their performance. To test our agents'
ability to capture distance-agnostic relationships between elements of the
gameboard, we design a minigame within the environment which is, by design,
unsolvable at large enough scales given strictly local strategies. Given the
game engine's extensive use of Cellular Automata, we also train our agents to
"play" Conway's Game of Life -- again optimizing for population -- and examine
their behaviour at multiple scales. To make our models compatible with
variable-scale gameplay, we use Neural Networks with recursive weights and
structure -- fractals to be truncated at different depths, dependent upon the
size of the gameboard.
- Abstract(参考訳): 我々は,simcity 1のゲームエンジンを用いて都市環境をシミュレートする強化学習環境であるgym-cityを紹介する。
我々は人口に注目し、訓練中に見たものよりも大きな地図サイズに一般化するエージェントの能力を分析する。
環境はインタラクティブで、トレーニングや推論中にエージェントと一緒に構築したり、学習のコースに影響を与えたり、手作業でパフォーマンスを調査、評価したりすることができる。
ゲームボードの要素間の距離に依存しない関係をとらえるエージェントの能力をテストするために、我々は、厳密な局所戦略で十分大きなスケールで解決できない環境内でミニゲームを設計する。
ゲームエンジンがセルラーオートマタを多用していることを考えると、エージェントにコンウェイのゲーム・オブ・ライフ(人口を最適化する)を「プレイ」するよう訓練し、その動作を複数のスケールで調査する。
モデルは可変スケールのゲームプレイと互換性を持たせるために、再帰的な重みと構造を持つニューラルネットワークを使用します。
関連論文リスト
- Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models [63.89598561397856]
室内環境における四足歩行操作のためのシステムを提案する。
オブジェクト操作にはフロントマウントのグリップを使用しており、アジャイルスキルにエゴセントリックな深さを使ってシミュレーションでトレーニングされた低レベルのコントローラである。
実世界のデータ収集やトレーニングを行なわずに、2つの目に見えない環境でシステムを評価する。
論文 参考訳(メタデータ) (2024-09-30T20:58:38Z) - Autoverse: An Evolvable Game Language for Learning Robust Embodied Agents [2.624282086797512]
シングルプレイヤ2Dグリッドベースのゲームのための,進化可能なドメイン固有言語であるAutoverseを紹介する。
オープンエンデッドラーニング(OEL)アルゴリズムのスケーラブルなトレーニンググラウンドとしての利用を実証する。
論文 参考訳(メタデータ) (2024-07-05T02:18:02Z) - Scaling Laws for Imitation Learning in Single-Agent Games [29.941613597833133]
我々は,モデルとデータサイズを慎重にスケールアップすることで,シングルエージェントゲームにおける模倣学習環境に類似した改善がもたらされるかどうかを検討する。
われわれはまずAtariのさまざまなゲームについて実験を行い、その後NetHackの非常に挑戦的なゲームに焦点を当てた。
IL損失と平均戻り値は計算予算とスムーズに一致し,相関関係が強く,計算最適ILエージェントの訓練には電力法則が適用されることがわかった。
論文 参考訳(メタデータ) (2023-07-18T16:43:03Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Multi-Game Decision Transformers [49.257185338595434]
そこで本研究では,1つのトランスフォーマーモデルを用いて,最大46個のAtariゲーム群を,人間に近いパフォーマンスで同時にプレイ可能であることを示す。
オンラインやオフラインのRL手法や行動クローンなど,マルチゲーム設定におけるいくつかのアプローチを比較した。
マルチゲーム決定変換モデルは、最高のスケーラビリティとパフォーマンスを提供します。
論文 参考訳(メタデータ) (2022-05-30T16:55:38Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - Learning to Simulate Dynamic Environments with GameGAN [109.25308647431952]
本稿では,エージェントが環境と対話するのを見ることでシミュレーターを学習することを目的とする。
ゲームGANは,学習中にスクリーンプレイやキーボード操作を取り入れることで,所望のゲームを視覚的に模倣することを学習する生成モデルである。
論文 参考訳(メタデータ) (2020-05-25T14:10:17Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。