論文の概要: Neural Game Engine: Accurate learning of generalizable forward models
from pixels
- arxiv url: http://arxiv.org/abs/2003.10520v2
- Date: Tue, 31 Mar 2020 20:50:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 00:18:39.138463
- Title: Neural Game Engine: Accurate learning of generalizable forward models
from pixels
- Title(参考訳): neural game engine: ピクセルから一般化したフォワードモデルの正確な学習
- Authors: Chris Bamford, Simon Lucas
- Abstract要約: 本稿では,ピクセルから直接モデルを学習する手段として,ニューラルゲームエンジンを紹介する。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争力のあるパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Access to a fast and easily copied forward model of a game is essential for
model-based reinforcement learning and for algorithms such as Monte Carlo tree
search, and is also beneficial as a source of unlimited experience data for
model-free algorithms. Learning forward models is an interesting and important
challenge in order to address problems where a model is not available. Building
upon previous work on the Neural GPU, this paper introduces the Neural Game
Engine, as a way to learn models directly from pixels. The learned models are
able to generalise to different size game levels to the ones they were trained
on without loss of accuracy. Results on 10 deterministic General Video Game AI
games demonstrate competitive performance, with many of the games models being
learned perfectly both in terms of pixel predictions and reward predictions.
The pre-trained models are available through the OpenAI Gym interface and are
available publicly for future research here:
\url{https://github.com/Bam4d/Neural-Game-Engine}
- Abstract(参考訳): ゲームの高速かつ容易にコピー可能なフォワードモデルへのアクセスは、モデルベースの強化学習やモンテカルロ木探索のようなアルゴリズムに不可欠であり、モデルフリーアルゴリズムの無制限体験データ源としても有用である。
モデルが利用できない問題に対処するために、前方モデルを学ぶことは興味深く重要な課題である。
本稿では,これまでのNeural GPUの研究に基づいて,ピクセルから直接モデルを学習する方法としてNeural Game Engineを紹介する。
学習したモデルは、異なるサイズのゲームレベルを、正確さを失うことなくトレーニングされたレベルに一般化することができる。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争性能を示し、多くのゲームモデルはピクセル予測と報酬予測の両方で完全に学習されている。
事前トレーニングされたモデルはOpenAI Gymインターフェースを通じて利用可能であり、将来の研究のために以下で公開されている。
関連論文リスト
- Predicting Long-horizon Futures by Conditioning on Geometry and Time [49.86180975196375]
我々は,過去を前提とした将来のセンサ観測の課題を探求する。
マルチモーダリティを扱える画像拡散モデルの大規模事前学習を活用する。
我々は、屋内と屋外のシーンにまたがる多様なビデオのセットについて、ビデオ予測のためのベンチマークを作成する。
論文 参考訳(メタデータ) (2024-04-17T16:56:31Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Initializing Models with Larger Ones [76.41561758293055]
事前訓練された大モデルから重みのサブセットを選択することにより、より小さなモデルを初期化する手法である重み選択を導入する。
実験により, 重量選択は小型モデルの性能を著しく向上し, トレーニング時間を短縮できることが示された。
論文 参考訳(メタデータ) (2023-11-30T18:58:26Z) - Wrapper Boxes: Faithful Attribution of Model Predictions to Training Data [40.7542543934205]
ニューラルモデルを通常のように訓練し、学習した特徴表現を古典的解釈可能なモデルで使用して予測を行う「ラッパーボックス」パイプラインを提案する。
異なる大きさの7つの言語モデルに対して、まず、ラッパー古典モデルの予測性能が元のニューラルモデルにほぼ匹敵することを示した。
我々のパイプラインは、古典的なモデル決定をデータトレーニングに忠実に寄与しながら、ニューラルネットワークモデルの予測性能を保っている。
論文 参考訳(メタデータ) (2023-11-15T01:50:53Z) - On the Steganographic Capacity of Selected Learning Models [1.0640226829362012]
本稿では,学習モデルの聴取能力について考察する。
幅広いモデルに対して、上書き可能な低次ビットの数を決定する。
テスト対象モデルのうち, LR実験では7.04KB, InceptionV3では44.74MBであった。
論文 参考訳(メタデータ) (2023-08-29T10:41:34Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - What Language Model Architecture and Pretraining Objective Work Best for
Zero-Shot Generalization? [50.84738303888189]
本稿では,モデル選択の大規模評価とそのゼロショット一般化への影響について述べる。
私たちは、70億以上のトークンに対して、50億以上のパラメータを持つモデルをトレーニングします。
事前学習した因果デコーダモデルを非因果デコーダモデルに効率的に適用できることが判明した。
論文 参考訳(メタデータ) (2022-04-12T14:19:49Z) - Towards Action Model Learning for Player Modeling [1.9659095632676098]
プレイヤーモデリングは、ゲームにおけるプレイヤーの振る舞いを正確に近似する計算モデルを作ろうとする。
ほとんどのプレイヤーモデリング技術はドメイン知識に依存しており、ゲーム間で転送できない。
本稿では,アクションモデル学習(AML)を用いて,ドメインに依存しない方法でプレーヤモデルを学習する。
論文 参考訳(メタデータ) (2021-03-09T19:32:30Z) - Model-Based Reinforcement Learning for Atari [89.3039240303797]
エージェントがモデルフリーの手法よりも少ないインタラクションでAtariゲームを解くことができることを示す。
本実験は,エージェントと環境間の100kの相互作用の少ないデータ構造における,AtariゲームにおけるSimPLeの評価である。
論文 参考訳(メタデータ) (2019-03-01T15:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。