論文の概要: Playing 2048 With Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2110.10374v1
- Date: Wed, 20 Oct 2021 05:02:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 16:09:50.173769
- Title: Playing 2048 With Reinforcement Learning
- Title(参考訳): 強化学習で2048をプレイする
- Authors: Shilun Li, Veronica Peng
- Abstract要約: 本稿では,2048年に勝利するための強化学習手法について検討する。
我々のアプローチには、深いQ-ラーニングとビームサーチがあり、ビームサーチは2048 28.5時間に達する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The game of 2048 is a highly addictive game. It is easy to learn the game,
but hard to master as the created game revealed that only about 1% games out of
hundreds million ever played have been won. In this paper, we would like to
explore reinforcement learning techniques to win 2048. The approaches we have
took include deep Q-learning and beam search, with beam search reaching 2048
28.5 of time.
- Abstract(参考訳): 2048年のゲームは、非常に中毒的なゲームです。
ゲームを学ぶのは簡単だが、何億回もプレイされたゲームのうち、わずか1%のゲームしか勝たないことが明らかになったため、マスターすることは難しい。
本稿では,2048年に勝利するための強化学習手法について検討する。
私たちが行ったアプローチには、深いqラーニングとビームサーチが含まれ、ビームサーチが204828.5時間に達する。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Reinforcement Learning for High-Level Strategic Control in Tower Defense Games [47.618236610219554]
戦略ゲームにおいて、ゲームデザインの最も重要な側面の1つは、プレイヤーにとっての挑戦の感覚を維持することである。
従来のスクリプティング手法と強化学習を組み合わせた自動手法を提案する。
その結果、強化学習のような学習アプローチとスクリプトAIを組み合わせることで、AIのみを使用するよりも高性能で堅牢なエージェントが生まれることが示された。
論文 参考訳(メタデータ) (2024-06-12T08:06:31Z) - Technical Challenges of Deploying Reinforcement Learning Agents for Game
Testing in AAA Games [58.720142291102135]
本稿では,既存の自動ゲームテストソリューションに,スクリプト型ボットをベースとして,実験的な強化学習システムを追加する取り組みについて述べる。
ゲーム制作において強化学習を活用するためのユースケースを示し、ゲームのために同じ旅をしたいと思う人なら誰でも遭遇する最大の時間をカバーしています。
我々は、機械学習、特にゲーム生産において効果的なツールである強化学習を作るのに価値があり、必要であると考えるいくつかの研究指針を提案する。
論文 参考訳(メタデータ) (2023-07-19T18:19:23Z) - Targeted Search Control in AlphaZero for Effective Policy Improvement [93.30151539224144]
我々はAlphaZeroの新しい検索制御戦略であるGo-Exploitを紹介する。
Go-Exploitは、関心のある状態のアーカイブからセルフプレイトラジェクトリの開始状態をサンプリングする。
Go-Exploitは、標準のAlphaZeroよりも優れたサンプル効率で学習する。
論文 参考訳(メタデータ) (2023-02-23T22:50:24Z) - On Reinforcement Learning for the Game of 2048 [0.8223798883838329]
この論文は2048年の強化学習とコンピュータゲームアルゴリズムに関する包括的な研究を行っている。
2048 の最先端プログラムが開発され,すべての学習プログラムの中で最も高い性能を達成している。
提案したコース設計では,2048種類のゲームを初心者が強化学習やコンピュータゲームアルゴリズムを学ぶための教材として使用する。
論文 参考訳(メタデータ) (2022-12-21T15:33:01Z) - Solving Royal Game of Ur Using Reinforcement Learning [0.0]
我々はモンテカルロ、クラーニング、サーサといった異なる手法を用いてエージェントを訓練し、戦略的なUrゲームを行うための最適なポリシーを学ぶ。
アルゴリズムによる限られたリソースで訓練された場合、全体的なパフォーマンスは向上するが、期待されるSarsaは、学習の高速化に関して有望な結果を示す。
論文 参考訳(メタデータ) (2022-08-23T01:26:37Z) - Mastering the Game of Stratego with Model-Free Multiagent Reinforcement
Learning [86.37438204416435]
Strategoは、人工知能(AI)がまだマスターしていない数少ない象徴的なボードゲームの一つだ。
ストラテゴにおける決定は、行動と結果の間に明らかな結びつきがなく、多数の個別の行動に対してなされる。
DeepNashは、ストラテゴの既存の最先端AIメソッドを破り、Gravonゲームプラットフォームで年間(2022年)と最高3位を達成した。
論文 参考訳(メタデータ) (2022-06-30T15:53:19Z) - Reinforcement Learning For Constraint Satisfaction Game Agents
(15-Puzzle, Minesweeper, 2048, and Sudoku) [0.0]
Deep Q-LearningはAtariやAlphaGoといったゲームで有望な結果を示している。
我々は,4つの制約満足度ゲームの制御ポリシーを学習するために,Qラーニングと深層Qラーニングを使用する。
これらのゲームは強化学習の可能性と限界に関するユニークな洞察を与える。
論文 参考訳(メタデータ) (2021-02-09T22:29:29Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Polygames: Improved Zero Learning [21.114734326593002]
DeepMindのAlphaZero以来、ゼロラーニングは多くのボードゲームで最先端の手法となった。
ゲームライブラリとチェックポイントを備えた,ゼロ学習のためのフレームワークであるPolygamesをリリースする。
私たちは1919年のヘックスの試合で強い人間と対戦しました。
論文 参考訳(メタデータ) (2020-01-27T14:49:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。