論文の概要: Neural Game Engine: Accurate learning of generalizable forward models
from pixels
- arxiv url: http://arxiv.org/abs/2003.10520v2
- Date: Tue, 31 Mar 2020 20:50:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 00:18:39.138463
- Title: Neural Game Engine: Accurate learning of generalizable forward models
from pixels
- Title(参考訳): neural game engine: ピクセルから一般化したフォワードモデルの正確な学習
- Authors: Chris Bamford, Simon Lucas
- Abstract要約: 本稿では,ピクセルから直接モデルを学習する手段として,ニューラルゲームエンジンを紹介する。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争力のあるパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Access to a fast and easily copied forward model of a game is essential for
model-based reinforcement learning and for algorithms such as Monte Carlo tree
search, and is also beneficial as a source of unlimited experience data for
model-free algorithms. Learning forward models is an interesting and important
challenge in order to address problems where a model is not available. Building
upon previous work on the Neural GPU, this paper introduces the Neural Game
Engine, as a way to learn models directly from pixels. The learned models are
able to generalise to different size game levels to the ones they were trained
on without loss of accuracy. Results on 10 deterministic General Video Game AI
games demonstrate competitive performance, with many of the games models being
learned perfectly both in terms of pixel predictions and reward predictions.
The pre-trained models are available through the OpenAI Gym interface and are
available publicly for future research here:
\url{https://github.com/Bam4d/Neural-Game-Engine}
- Abstract(参考訳): ゲームの高速かつ容易にコピー可能なフォワードモデルへのアクセスは、モデルベースの強化学習やモンテカルロ木探索のようなアルゴリズムに不可欠であり、モデルフリーアルゴリズムの無制限体験データ源としても有用である。
モデルが利用できない問題に対処するために、前方モデルを学ぶことは興味深く重要な課題である。
本稿では,これまでのNeural GPUの研究に基づいて,ピクセルから直接モデルを学習する方法としてNeural Game Engineを紹介する。
学習したモデルは、異なるサイズのゲームレベルを、正確さを失うことなくトレーニングされたレベルに一般化することができる。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争性能を示し、多くのゲームモデルはピクセル予測と報酬予測の両方で完全に学習されている。
事前トレーニングされたモデルはOpenAI Gymインターフェースを通じて利用可能であり、将来の研究のために以下で公開されている。
関連論文リスト
- Initializing Models with Larger Ones [76.41561758293055]
事前訓練された大モデルから重みのサブセットを選択することにより、より小さなモデルを初期化する手法である重み選択を導入する。
実験により, 重量選択は小型モデルの性能を著しく向上し, トレーニング時間を短縮できることが示された。
論文 参考訳(メタデータ) (2023-11-30T18:58:26Z) - On the Steganographic Capacity of Selected Learning Models [1.0640226829362012]
本稿では,学習モデルの聴取能力について考察する。
幅広いモデルに対して、上書き可能な低次ビットの数を決定する。
テスト対象モデルのうち, LR実験では7.04KB, InceptionV3では44.74MBであった。
論文 参考訳(メタデータ) (2023-08-29T10:41:34Z) - Probabilistic Adaptation of Text-to-Video Models [181.84311524681536]
Video Adapterは、タスク固有の小さなビデオモデルに、幅広い知識を取り入れ、大きな事前訓練されたビデオモデルの忠実度を維持することができる。
Video Adapterは、アニメーション、エゴセントリックなモデリング、シミュレートされた実世界のロボティクスデータのモデリングなど、さまざまなタスクで高品質で特殊なビデオを生成することができる。
論文 参考訳(メタデータ) (2023-06-02T19:00:17Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Knowledge Transfer For On-Device Speech Emotion Recognition with Neural
Structured Learning [19.220263739291685]
音声感情認識(SER)は、ヒューマン・コンピュータ・インタラクション(HCI)において人気のある研究トピックである。
合成グラフ構築によるニューラル構造化学習(NSL)フレームワークを提案する。
実験の結果,音声サンプルとグラフを用いた軽量SERモデルの訓練は,小さなSERモデルを生成するだけでなく,モデル性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-10-26T18:38:42Z) - Composing Ensembles of Pre-trained Models via Iterative Consensus [95.10641301155232]
本稿では,異なる事前学習モデルのアンサンブルを構成するための統一的なフレームワークを提案する。
事前学習したモデルを「ジェネレータ」あるいは「スコーラ」として使用し、クローズドループ反復コンセンサス最適化により構成する。
スコアラーのアンサンブルによって達成されたコンセンサスは、シングルスコアラーのフィードバックよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-20T18:46:31Z) - Revealing Secrets From Pre-trained Models [2.0249686991196123]
トランスファーラーニングは多くの新しいディープラーニングアルゴリズムで広く採用されている。
本研究では,事前学習モデルと微調整モデルが重み値に非常によく似ていることを示す。
ブラックボックスの被害者モデルで使用されるモデルアーキテクチャと事前訓練モデルを明らかにするモデル抽出攻撃を提案する。
論文 参考訳(メタデータ) (2022-07-19T20:19:03Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - What Language Model Architecture and Pretraining Objective Work Best for
Zero-Shot Generalization? [50.84738303888189]
本稿では,モデル選択の大規模評価とそのゼロショット一般化への影響について述べる。
私たちは、70億以上のトークンに対して、50億以上のパラメータを持つモデルをトレーニングします。
事前学習した因果デコーダモデルを非因果デコーダモデルに効率的に適用できることが判明した。
論文 参考訳(メタデータ) (2022-04-12T14:19:49Z) - Towards Action Model Learning for Player Modeling [1.9659095632676098]
プレイヤーモデリングは、ゲームにおけるプレイヤーの振る舞いを正確に近似する計算モデルを作ろうとする。
ほとんどのプレイヤーモデリング技術はドメイン知識に依存しており、ゲーム間で転送できない。
本稿では,アクションモデル学習(AML)を用いて,ドメインに依存しない方法でプレーヤモデルを学習する。
論文 参考訳(メタデータ) (2021-03-09T19:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。