論文の概要: Playing Chess with Limited Look Ahead
- arxiv url: http://arxiv.org/abs/2007.02130v1
- Date: Sat, 4 Jul 2020 16:02:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 13:11:10.035514
- Title: Playing Chess with Limited Look Ahead
- Title(参考訳): 限られた視野でチェスをする
- Authors: Arman Maesumi
- Abstract要約: 静的評価関数として機能するために、ディープニューラルネットワークをトレーニングする。
我々は,我々の静的評価関数が,先見的な知識をコード化していることを示す。
先見深度に厳格な制限があるにもかかわらず、我々のエンジンはサンプル位置の約83%で同等の強度の移動を推奨している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We have seen numerous machine learning methods tackle the game of chess over
the years. However, one common element in these works is the necessity of a
finely optimized look ahead algorithm. The particular interest of this research
lies with creating a chess engine that is highly capable, but restricted in its
look ahead depth. We train a deep neural network to serve as a static
evaluation function, which is accompanied by a relatively simple look ahead
algorithm. We show that our static evaluation function has encoded some
semblance of look ahead knowledge, and is comparable to classical evaluation
functions. The strength of our chess engine is assessed by comparing its
proposed moves against those proposed by Stockfish. We show that, despite
strict restrictions on look ahead depth, our engine recommends moves of equal
strength in roughly $83\%$ of our sample positions.
- Abstract(参考訳): 長年にわたり、チェスのゲームに取り組む機械学習の手法が数多く見てきた。
しかし、これらの研究でよく見られる要素は、最適化されたルックフォワードアルゴリズムの必要性である。
この研究の特に興味は、高度な能力を持つが、前方の奥行きが制限されるチェスエンジンを作ることである。
ディープニューラルネットワークを,比較的単純なルックフォワードアルゴリズムを伴って静的評価関数として使用するようにトレーニングする。
静的評価関数は,先見的知識の類似性を符号化し,古典的評価関数に匹敵することを示した。
チェスエンジンの強度は,Stockfishの提案したものとの比較によって評価される。
我々のエンジンは、前景深度の厳格な制限にもかかわらず、サンプル位置の約$83\%で同等の強度の移動を推奨している。
関連論文リスト
- Superior Computer Chess with Model Predictive Control, Reinforcement Learning, and Rollout [2.68187684471817]
移動選択のための新しいアーキテクチャを導入し、利用可能なチェスエンジンをコンポーネントとして使用する。
1基のエンジンは値空間MPC/RLスキームの近似における位置評価を提供するのに使われ、もう1基のエンジンは名目上の反対として使用される。
我々のアーキテクチャは位置評価エンジンの性能を大幅に改善することを示します。
論文 参考訳(メタデータ) (2024-09-10T13:05:45Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Predicting User Perception of Move Brilliance in Chess [3.434553688053531]
チェスの動きを華々しく分類する最初のシステムを示す。
精度は79%(ベースレート50%)、PPVは83%、NPVは75%である。
より弱いエンジンが低品質とみなすと、この動きは輝かしく、すべて等しいと予測される傾向が示される。
論文 参考訳(メタデータ) (2024-06-14T17:46:26Z) - Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。
ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。
極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文 参考訳(メタデータ) (2024-02-07T00:36:24Z) - Curiosity-Driven Reinforcement Learning based Low-Level Flight Control [95.42181254494287]
本研究では,オドメトリデータから適切な運動速度を生成することにより,自律学習のための好奇心の駆動に基づくアルゴリズムを提案する。
探索パターンの進化における好奇心の効果を可視化したアルゴリズムとアルゴリズムを用いて、オン・ポリティ、オフ・ポリティ、オン・ポリティ、オン・ポリティと好奇心を用いたテストを実行した。
論文 参考訳(メタデータ) (2023-07-28T11:46:28Z) - The Value of Chess Squares [5.647533385886476]
我々のモデルは、入力として三重項(色、ピアース、正方形)を取り、この片をこの四角形に持つ利点/欠点を測る値を計算する。
我々の手法はチェスAIの最近の進歩に基づいて構築されており、チェスのゲームにおけるポジションの価値を正確に評価することができる。
論文 参考訳(メタデータ) (2023-07-08T20:17:24Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - Memory Bounds for the Experts Problem [53.67419690563877]
専門家のアドバイスによるオンライン学習は、逐次予測の根本的な問題である。
目標は、予測を処理し、最小コストで予測を行うことです。
アルゴリズムは、そのセットでもっとも優れた専門家と比較してどれだけうまく機能するかによって判断される。
論文 参考訳(メタデータ) (2022-04-21T01:22:18Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。