論文の概要: Playing Chess with Limited Look Ahead
- arxiv url: http://arxiv.org/abs/2007.02130v1
- Date: Sat, 4 Jul 2020 16:02:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 13:11:10.035514
- Title: Playing Chess with Limited Look Ahead
- Title(参考訳): 限られた視野でチェスをする
- Authors: Arman Maesumi
- Abstract要約: 静的評価関数として機能するために、ディープニューラルネットワークをトレーニングする。
我々は,我々の静的評価関数が,先見的な知識をコード化していることを示す。
先見深度に厳格な制限があるにもかかわらず、我々のエンジンはサンプル位置の約83%で同等の強度の移動を推奨している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We have seen numerous machine learning methods tackle the game of chess over
the years. However, one common element in these works is the necessity of a
finely optimized look ahead algorithm. The particular interest of this research
lies with creating a chess engine that is highly capable, but restricted in its
look ahead depth. We train a deep neural network to serve as a static
evaluation function, which is accompanied by a relatively simple look ahead
algorithm. We show that our static evaluation function has encoded some
semblance of look ahead knowledge, and is comparable to classical evaluation
functions. The strength of our chess engine is assessed by comparing its
proposed moves against those proposed by Stockfish. We show that, despite
strict restrictions on look ahead depth, our engine recommends moves of equal
strength in roughly $83\%$ of our sample positions.
- Abstract(参考訳): 長年にわたり、チェスのゲームに取り組む機械学習の手法が数多く見てきた。
しかし、これらの研究でよく見られる要素は、最適化されたルックフォワードアルゴリズムの必要性である。
この研究の特に興味は、高度な能力を持つが、前方の奥行きが制限されるチェスエンジンを作ることである。
ディープニューラルネットワークを,比較的単純なルックフォワードアルゴリズムを伴って静的評価関数として使用するようにトレーニングする。
静的評価関数は,先見的知識の類似性を符号化し,古典的評価関数に匹敵することを示した。
チェスエンジンの強度は,Stockfishの提案したものとの比較によって評価される。
我々のエンジンは、前景深度の厳格な制限にもかかわらず、サンプル位置の約$83\%で同等の強度の移動を推奨している。
関連論文リスト
- Grandmaster-Level Chess Without Search [9.5790772976207]
我々は、1000万のチェスゲームのデータセットに基づいて教師付き学習を伴うモデルを訓練する。
われわれの最大のモデルは2895年のリチェス・ブリッツ・エロ(Lichess blitz Elo)に到達した。
モデルとデータセットのサイズを体系的に調べると、強力なチェスのパフォーマンスは十分な規模でしか発生しない。
論文 参考訳(メタデータ) (2024-02-07T00:36:24Z) - Learning to Play Chess from Textbooks (LEAP): a Corpus for Evaluating
Chess Moves based on Sentiment Analysis [4.314956204483074]
本稿では,チェスの遊び方を学ぶための新しい知識源として,チェスの教科書について検討する。
我々はLEAPコーパスを開発した。LEAPコーパスは、構造化された(記法やボード状態を動かす)構造付きおよび非構造化データを備えた、最初の、そして新しい異種データセットである。
感情分析のための各種変圧器ベースラインモデルの性能評価実験を行った。
論文 参考訳(メタデータ) (2023-10-31T08:26:02Z) - Curiosity-Driven Reinforcement Learning based Low-Level Flight Control [95.42181254494287]
本研究では,オドメトリデータから適切な運動速度を生成することにより,自律学習のための好奇心の駆動に基づくアルゴリズムを提案する。
探索パターンの進化における好奇心の効果を可視化したアルゴリズムとアルゴリズムを用いて、オン・ポリティ、オフ・ポリティ、オン・ポリティ、オン・ポリティと好奇心を用いたテストを実行した。
論文 参考訳(メタデータ) (2023-07-28T11:46:28Z) - The Value of Chess Squares [5.647533385886476]
我々のモデルは、入力として三重項(色、ピアース、正方形)を取り、この片をこの四角形に持つ利点/欠点を測る値を計算する。
我々の手法はチェスAIの最近の進歩に基づいて構築されており、チェスのゲームにおけるポジションの価値を正確に評価することができる。
論文 参考訳(メタデータ) (2023-07-08T20:17:24Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - Memory Bounds for the Experts Problem [53.67419690563877]
専門家のアドバイスによるオンライン学習は、逐次予測の根本的な問題である。
目標は、予測を処理し、最小コストで予測を行うことです。
アルゴリズムは、そのセットでもっとも優れた専門家と比較してどれだけうまく機能するかによって判断される。
論文 参考訳(メタデータ) (2022-04-21T01:22:18Z) - Measuring the Non-Transitivity in Chess [19.618609913302855]
我々は、人間のプレイヤーの実際のデータを通してチェスの非透過性を定量化する。
非透過性の度合いとチェス選手のレーティングの進行との間には強いつながりがある。
論文 参考訳(メタデータ) (2021-10-22T12:15:42Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。