論文の概要: Learning Chess With Language Models and Transformers
- arxiv url: http://arxiv.org/abs/2209.11902v1
- Date: Sat, 24 Sep 2022 01:22:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 14:01:53.615047
- Title: Learning Chess With Language Models and Transformers
- Title(参考訳): 言語モデルとトランスフォーマーによるチェスの学習
- Authors: Michael DeLeo, Erhan Guven
- Abstract要約: ボードゲームとその位置をテキストベースの表記で表現することで、NLPアプリケーションが可能となる。
BERTモデルは、まず単純なNimゲームに、数ショットの学習アーキテクチャのセットアップでノイズの存在下でのパフォーマンスを分析する。
モデルはチェスゲームのルールを実質的に学習し、カテゴリーAの格付けレベルでストックフィッシュと対戦して生き残ることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Representing a board game and its positions by text-based notation enables
the possibility of NLP applications. Language models, can help gain insight
into a variety of interesting problems such as unsupervised learning rules of a
game, detecting player behavior patterns, player attribution, and ultimately
learning the game to beat state of the art. In this study, we applied BERT
models, first to the simple Nim game to analyze its performance in the presence
of noise in a setup of a few-shot learning architecture. We analyzed the model
performance via three virtual players, namely Nim Guru, Random player, and
Q-learner. In the second part, we applied the game learning language model to
the chess game, and a large set of grandmaster games with exhaustive
encyclopedia openings. Finally, we have shown that model practically learns the
rules of the chess game and can survive games against Stockfish at a category-A
rating level.
- Abstract(参考訳): ボードゲームとその位置をテキストベースの表記で表現することで、NLPアプリケーションが可能となる。
言語モデルは、ゲームの教師なし学習ルール、プレイヤーの行動パターンの検出、プレイヤーの帰属、最終的にゲームの状態を破るためにゲームを学ぶなど、さまざまな興味深い問題に対する洞察を得るのに役立つ。
本研究では,まず,単純なnimゲームにbertモデルを適用し,数発学習アーキテクチャのセットアップにおいて,ノイズの存在下でのパフォーマンスを解析した。
我々は,Nim Guru,Random Player,Q-learnerという3つの仮想プレイヤーを用いてモデル性能を解析した。
第2部では,ゲーム学習言語モデルをチェスゲームに適用し,百科事典を網羅した大量のグランドマスターゲームについて検討した。
最後に, モデルがチェスゲームのルールを実質的に学習し, カテゴリーAのレーティングレベルにおいてストックフィッシュと対戦して生き残ることを示す。
関連論文リスト
- Visually Grounded Language Learning: a review of language games,
datasets, tasks, and models [60.2604624857992]
多くのVision+Language (V+L)タスクは、視覚的モダリティでシンボルをグラウンドできるモデルを作成することを目的として定義されている。
本稿では,V+L分野において提案されるいくつかの課題とモデルについて,系統的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-12-05T02:17:29Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - WinoGAViL: Gamified Association Benchmark to Challenge
Vision-and-Language Models [91.92346150646007]
本研究では,視覚・言語関係を収集するオンラインゲームであるWinoGAViLを紹介する。
私たちはこのゲームを使って3.5Kのインスタンスを収集し、それらが人間には直感的だが最先端のAIモデルには挑戦的であることを発見した。
我々の分析とプレイヤーからのフィードバックは、収集された協会が多様な推論スキルを必要とすることを示している。
論文 参考訳(メタデータ) (2022-07-25T23:57:44Z) - Impartial Games: A Challenge for Reinforcement Learning [0.0]
我々はAlphaZeroスタイルの強化学習アルゴリズムが、プレイヤーが駒を共有する公平なゲームにおいて課題に直面していることを示す。
Nimは小さなボード上で学習できるが、AlphaZeroスタイルのアルゴリズムの学習の進歩は、ボードのサイズが大きくなると劇的に遅くなる。
論文 参考訳(メタデータ) (2022-05-25T14:02:02Z) - Towards Action Model Learning for Player Modeling [1.9659095632676098]
プレイヤーモデリングは、ゲームにおけるプレイヤーの振る舞いを正確に近似する計算モデルを作ろうとする。
ほとんどのプレイヤーモデリング技術はドメイン知識に依存しており、ゲーム間で転送できない。
本稿では,アクションモデル学習(AML)を用いて,ドメインに依存しない方法でプレーヤモデルを学習する。
論文 参考訳(メタデータ) (2021-03-09T19:32:30Z) - Learning Chess Blindfolded: Evaluating Language Models on State Tracking [69.3794549747725]
私たちはチェスのゲームのための言語モデリングのタスクを検討します。
自然言語とは異なり、チェス表記法は単純で制約のある決定論的領域を記述する。
トランスフォーマー言語モデルでは,移動シーケンスのみを訓練することで,ピースの追跡や法的動作の予測を高精度に行うことができる。
論文 参考訳(メタデータ) (2021-02-26T01:16:23Z) - Keep CALM and Explore: Language Models for Action Generation in
Text-based Games [27.00685301984832]
本研究では,各ゲーム状態におけるアクション候補のコンパクトなセットを生成するために,文脈行動言語モデル(CALM)を提案する。
我々はCALMと強化学習エージェントを組み合わせることで、生成したアクション候補を再ランクし、ゲーム内報酬を最大化する。
論文 参考訳(メタデータ) (2020-10-06T17:36:29Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Neural Game Engine: Accurate learning of generalizable forward models
from pixels [0.0]
本稿では,ピクセルから直接モデルを学習する手段として,ニューラルゲームエンジンを紹介する。
10の決定論的汎用ビデオゲームAIゲームの結果は、競争力のあるパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-23T20:04:55Z) - Deep Reinforcement Learning for FlipIt Security Game [2.0624765454705654]
本稿では,エージェントが対戦者の異なるクラスに適応し,最適な対ストラテジーを学習する深層学習モデルについて述べる。
FlipItは、プレイヤー、攻撃者、ディフェンダーの双方が共有リソースの所有権を競う2人プレイのセキュリティゲームです。
我々のモデルは、Qラーニングと組み合わせたディープニューラルネットワークであり、リソースの所有時間の最大化のために訓練されている。
論文 参考訳(メタデータ) (2020-02-28T18:26:24Z) - Exploration Based Language Learning for Text-Based Games [72.30525050367216]
本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
論文 参考訳(メタデータ) (2020-01-24T03:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。