論文の概要: The Value of Chess Squares
- arxiv url: http://arxiv.org/abs/2307.05330v2
- Date: Tue, 10 Oct 2023 00:35:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 08:07:07.962531
- Title: The Value of Chess Squares
- Title(参考訳): チェスの正方形の価値
- Authors: Aditya Gupta and Shiva Maharaj and Nicholas Polson and Vadim Sokolov
- Abstract要約: 我々のモデルは、入力として三重項(色、ピアース、正方形)を取り、この片をこの四角形に持つ利点/欠点を測る値を計算する。
我々の手法はチェスAIの最近の進歩に基づいて構築されており、チェスのゲームにおけるポジションの価値を正確に評価することができる。
- 参考スコア(独自算出の注目度): 5.647533385886476
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose a neural network-based approach to calculate the value of a chess
square-piece combination. Our model takes a triplet (Color, Piece, Square) as
an input and calculates a value that measures the advantage/disadvantage of
having this piece on this square. Our methods build on recent advances in chess
AI, and can accurately assess the worth of positions in a game of chess. The
conventional approach assigns fixed values to pieces $(\symking=\infty,
\symqueen=9, \symrook=5, \symbishop=3, \symknight=3, \sympawn=1)$. We enhance
this analysis by introducing marginal valuations. We use deep Q-learning to
estimate the parameters of our model. We demonstrate our method by examining
the positioning of Knights and Bishops, and also provide valuable insights into
the valuation of pawns. Finally, we conclude by suggesting potential avenues
for future research.
- Abstract(参考訳): チェスの平方要素の組み合わせの値をニューラルネットワークで計算する手法を提案する。
我々のモデルは、入力として三重項(カラー、ピアース、スクエア)を取り、この片をこの四角に持つ利点/欠点を測る値を計算する。
本手法はチェスaiの最近の進歩を基盤とし,チェスのゲームにおける位置を正確に評価する。
従来の手法では固定値を$(\symking=\infty, \symqueen=9, \symrook=5, \symbishop=3, \symknight=3, \sympawn=1)$に割り当てる。
我々はこの分析を限界評価の導入によって強化する。
ディープラーニングを使ってモデルのパラメータを推定します。
我々は、騎士と司教の位置を調べることによって我々の方法を示し、ポーンの評価について貴重な洞察を提供する。
最後に,今後の研究への道筋を示唆する。
関連論文リスト
- End-to-End Chess Recognition [11.15543089335477]
現在のアプローチでは、チェスボードの検出、平方ローカライゼーション、ピース分類といった独立した独立したモジュールのパイプラインを使用している。
本稿では、画像から構成を直接予測するエンドツーエンドアプローチについて検討し、シーケンシャルアプローチのエラー蓄積を回避する。
合成レンダリングされ、角度が限られている既存のデータセットとは対照的に、ChessReDはスマートフォンカメラを使ってさまざまな角度から撮影されている。
ChessReDのテスト画像の15.26%で、チェスのピースの構成を認識することに成功した。
論文 参考訳(メタデータ) (2023-10-06T08:30:20Z) - Statistical analysis of chess games: space control and tipping points [0.0]
まず,空間特性と駒の位置に着目し,ゲーム中の移動回数が結果と正の相関関係にあることを示す。
次に、部品のヒートマップを研究し、その空間分布が、エンジン(例えば、ストックフィッシュ)よりも人間のプレイヤー間では変化しないことを示す。
論文 参考訳(メタデータ) (2023-04-22T14:54:34Z) - Representation Learning for General-sum Low-rank Markov Games [63.119870889883224]
非線形関数近似を用いたマルチエージェント汎用マルコフゲームについて検討する。
遷移行列が未知の非線形表現の上に隠れた低ランク構造を持つ低ランクマルコフゲームに焦点を当てる。
論文 参考訳(メタデータ) (2022-10-30T22:58:22Z) - There is no Accuracy-Interpretability Tradeoff in Reinforcement Learning
for Mazes [64.05903267230467]
相互理解性は,強化学習システムにおける信頼性に不可欠なビルディングブロックである。
場合によっては、最適性を保ちつつ、政策の解釈可能性を達成することができることを示す。
論文 参考訳(メタデータ) (2022-06-09T04:23:26Z) - Measuring the Non-Transitivity in Chess [19.618609913302855]
我々は、人間のプレイヤーの実際のデータを通してチェスの非透過性を定量化する。
非透過性の度合いとチェス選手のレーティングの進行との間には強いつながりがある。
論文 参考訳(メタデータ) (2021-10-22T12:15:42Z) - Towards General Function Approximation in Zero-Sum Markov Games [126.58493169301012]
本稿では,同時移動を伴う2プレーヤゼロサム有限ホライゾンマルコフゲームについて考察する。
分離された設定とコーディネートされた設定の両方の効率的なアルゴリズムが開発されている。
論文 参考訳(メタデータ) (2021-07-30T15:25:13Z) - Determining Chess Game State From an Image [19.06796946564999]
本稿では,既存のモデルよりも桁違いに大きい3次元モデルから合成した新しいデータセットについて述べる。
従来のコンピュータビジョン技術とディープラーニングを組み合わせた新しいエンドツーエンドチェス認識システムを紹介します。
記述されたシステムでは,テストセット上での誤差率は0.23%であり,現状の28倍である。
論文 参考訳(メタデータ) (2021-04-30T13:02:13Z) - Almost Optimal Algorithms for Two-player Markov Games with Linear
Function Approximation [92.99933928528797]
同時動作による2プレイヤーゼロサムマルコフゲームの強化学習について検討した。
我々は,「不確かさの最適性」に基づくアルゴリズムナッシュ-UCRL-VTRを提案する。
我々は、Nash-UCRL-VTR が $tildeO(dHsqrtT)$ regret を確実に達成できることを示し、$d$ は線型関数次元である。
論文 参考訳(メタデータ) (2021-02-15T09:09:16Z) - Playing Chess with Limited Look Ahead [0.0]
静的評価関数として機能するために、ディープニューラルネットワークをトレーニングする。
我々は,我々の静的評価関数が,先見的な知識をコード化していることを示す。
先見深度に厳格な制限があるにもかかわらず、我々のエンジンはサンプル位置の約83%で同等の強度の移動を推奨している。
論文 参考訳(メタデータ) (2020-07-04T16:02:43Z) - Near-Optimal Reinforcement Learning with Self-Play [50.29853537456737]
我々は,直接の監督なしに自己対決で最適な政策を学習するセルフプレイアルゴリズムに焦点をあてる。
本稿では,サンプル複雑性を$tildemathcalO(SAB)$,サンプル複雑性を$tildemathcalO(S(A+B)$とする新しいemphNash Vラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T05:00:13Z) - Learning Zero-Sum Simultaneous-Move Markov Games Using Function
Approximation and Correlated Equilibrium [116.56359444619441]
両プレイヤーのゼロサム有限ホライゾンマルコフゲームに対する効率の良い強化学習アルゴリズムを開発した。
オフライン環境では、両プレイヤーを制御し、双対性ギャップを最小化してナッシュ平衡を求める。
オンライン環境では、任意の相手と対戦する1人のプレイヤーを制御し、後悔を最小限に抑える。
論文 参考訳(メタデータ) (2020-02-17T17:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。