Fugu-MT 論文翻訳(概要): Playing Chess with Limited Look Ahead

論文の概要: Playing Chess with Limited Look Ahead

arxiv url: http://arxiv.org/abs/2007.02130v1
Date: Sat, 4 Jul 2020 16:02:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-13 13:11:10.035514
Title: Playing Chess with Limited Look Ahead
Title（参考訳）: 限られた視野でチェスをする
Authors: Arman Maesumi
Abstract要約: 静的評価関数として機能するために、ディープニューラルネットワークをトレーニングする。我々は,我々の静的評価関数が,先見的な知識をコード化していることを示す。先見深度に厳格な制限があるにもかかわらず、我々のエンジンはサンプル位置の約83%で同等の強度の移動を推奨している。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We have seen numerous machine learning methods tackle the game of chess over the years. However, one common element in these works is the necessity of a finely optimized look ahead algorithm. The particular interest of this research lies with creating a chess engine that is highly capable, but restricted in its look ahead depth. We train a deep neural network to serve as a static evaluation function, which is accompanied by a relatively simple look ahead algorithm. We show that our static evaluation function has encoded some semblance of look ahead knowledge, and is comparable to classical evaluation functions. The strength of our chess engine is assessed by comparing its proposed moves against those proposed by Stockfish. We show that, despite strict restrictions on look ahead depth, our engine recommends moves of equal strength in roughly $83\%$ of our sample positions.
Abstract（参考訳）: 長年にわたり、チェスのゲームに取り組む機械学習の手法が数多く見てきた。しかし、これらの研究でよく見られる要素は、最適化されたルックフォワードアルゴリズムの必要性である。この研究の特に興味は、高度な能力を持つが、前方の奥行きが制限されるチェスエンジンを作ることである。ディープニューラルネットワークを,比較的単純なルックフォワードアルゴリズムを伴って静的評価関数として使用するようにトレーニングする。静的評価関数は,先見的知識の類似性を符号化し,古典的評価関数に匹敵することを示した。チェスエンジンの強度は,Stockfishの提案したものとの比較によって評価される。我々のエンジンは、前景深度の厳格な制限にもかかわらず、サンプル位置の約$83\%で同等の強度の移動を推奨している。

関連論文リスト

Towards Piece-by-Piece Explanations for Chess Positions with SHAP [0.20305676256390937]
我々はSHAP(SHapley Additive exPlanations)に適応し、チェスエンジンの評価をボード上の特定の部品に割り当てる。部品を特徴として扱い、それらを体系的に非難することにより、エンジンの出力を説明する追加的、部品ごとのコントリビューションを計算する。この手法は古典的なチェスの教育からインスピレーションを得ており、プレイヤーは駒を精神的に取り除くことで位置を評価する。
論文参考訳（メタデータ） (2025-10-26T09:07:21Z)
Can Large Language Models Develop Strategic Reasoning? Post-training Insights from Learning Chess [54.5355907369231]
チェスにおける強化学習(RL)を通して,大規模言語モデル (LLM) が戦略的推論能力を発達させることができるかを検討する。以上の結果から, 蒸留法に基づく高密度報酬は, 希少な二進報酬よりも優れていることが示唆された。我々は、チェス推論訓練におけるSFTおよびRLの略語を提供し、この制限が、事前訓練されたモデルのチェスに対する内部理解の欠如に起因する証拠を見つける。
論文参考訳（メタデータ） (2025-07-01T13:16:34Z)
Superior Computer Chess with Model Predictive Control, Reinforcement Learning, and Rollout [2.68187684471817]
移動選択のための新しいアーキテクチャを導入し、利用可能なチェスエンジンをコンポーネントとして使用する。 1基のエンジンは値空間MPC/RLスキームの近似における位置評価を提供するのに使われ、もう1基のエンジンは名目上の反対として使用される。我々のアーキテクチャは位置評価エンジンの性能を大幅に改善することを示します。
論文参考訳（メタデータ） (2024-09-10T13:05:45Z)
Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。 GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文参考訳（メタデータ） (2024-07-22T06:12:21Z)
Predicting User Perception of Move Brilliance in Chess [3.434553688053531]
チェスの動きを華々しく分類する最初のシステムを示す。精度は79%(ベースレート50%)、PPVは83%、NPVは75%である。より弱いエンジンが低品質とみなすと、この動きは輝かしく、すべて等しいと予測される傾向が示される。
論文参考訳（メタデータ） (2024-06-14T17:46:26Z)
Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。 ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文参考訳（メタデータ） (2024-02-07T00:36:24Z)
Curiosity-Driven Reinforcement Learning based Low-Level Flight Control [95.42181254494287]
本研究では,オドメトリデータから適切な運動速度を生成することにより,自律学習のための好奇心の駆動に基づくアルゴリズムを提案する。探索パターンの進化における好奇心の効果を可視化したアルゴリズムとアルゴリズムを用いて、オン・ポリティ、オフ・ポリティ、オン・ポリティ、オン・ポリティと好奇心を用いたテストを実行した。
論文参考訳（メタデータ） (2023-07-28T11:46:28Z)
The Value of Chess Squares [5.647533385886476]
我々のモデルは、入力として三重項(色、ピアース、正方形)を取り、この片をこの四角形に持つ利点/欠点を測る値を計算する。我々の手法はチェスAIの最近の進歩に基づいて構築されており、チェスのゲームにおけるポジションの価値を正確に評価することができる。
論文参考訳（メタデータ） (2023-07-08T20:17:24Z)
Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文参考訳（メタデータ） (2022-11-07T18:43:25Z)
Memory Bounds for the Experts Problem [53.67419690563877]
専門家のアドバイスによるオンライン学習は、逐次予測の根本的な問題である。目標は、予測を処理し、最小コストで予測を行うことです。アルゴリズムは、そのセットでもっとも優れた専門家と比較してどれだけうまく機能するかによって判断される。
論文参考訳（メタデータ） (2022-04-21T01:22:18Z)
Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文参考訳（メタデータ） (2021-03-02T11:04:33Z)
LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文参考訳（メタデータ） (2020-12-12T16:48:40Z)
Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文参考訳（メタデータ） (2020-07-10T09:33:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。