Fugu-MT 論文翻訳(概要): The Value of Chess Squares

論文の概要: The Value of Chess Squares

arxiv url: http://arxiv.org/abs/2307.05330v2
Date: Tue, 10 Oct 2023 00:35:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-13 08:07:07.962531
Title: The Value of Chess Squares
Title（参考訳）: チェスの正方形の価値
Authors: Aditya Gupta and Shiva Maharaj and Nicholas Polson and Vadim Sokolov
Abstract要約: 我々のモデルは、入力として三重項(色、ピアース、正方形)を取り、この片をこの四角形に持つ利点/欠点を測る値を計算する。我々の手法はチェスAIの最近の進歩に基づいて構築されており、チェスのゲームにおけるポジションの価値を正確に評価することができる。
参考スコア（独自算出の注目度）: 5.647533385886476
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: We propose a neural network-based approach to calculate the value of a chess square-piece combination. Our model takes a triplet (Color, Piece, Square) as an input and calculates a value that measures the advantage/disadvantage of having this piece on this square. Our methods build on recent advances in chess AI, and can accurately assess the worth of positions in a game of chess. The conventional approach assigns fixed values to pieces $(\symking=\infty, \symqueen=9, \symrook=5, \symbishop=3, \symknight=3, \sympawn=1)$. We enhance this analysis by introducing marginal valuations. We use deep Q-learning to estimate the parameters of our model. We demonstrate our method by examining the positioning of Knights and Bishops, and also provide valuable insights into the valuation of pawns. Finally, we conclude by suggesting potential avenues for future research.
Abstract（参考訳）: チェスの平方要素の組み合わせの値をニューラルネットワークで計算する手法を提案する。我々のモデルは、入力として三重項(カラー、ピアース、スクエア)を取り、この片をこの四角に持つ利点/欠点を測る値を計算する。本手法はチェスaiの最近の進歩を基盤とし,チェスのゲームにおける位置を正確に評価する。従来の手法では固定値を$(\symking=\infty, \symqueen=9, \symrook=5, \symbishop=3, \symknight=3, \sympawn=1)$に割り当てる。我々はこの分析を限界評価の導入によって強化する。ディープラーニングを使ってモデルのパラメータを推定します。我々は、騎士と司教の位置を調べることによって我々の方法を示し、ポーンの評価について貴重な洞察を提供する。最後に,今後の研究への道筋を示唆する。

関連論文リスト

Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文参考訳（メタデータ） (2024-04-16T17:59:55Z)
Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。 ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文参考訳（メタデータ） (2024-02-07T00:36:24Z)
End-to-End Chess Recognition [11.15543089335477]
現在のアプローチでは、チェスボードの検出、平方ローカライゼーション、ピース分類といった独立した独立したモジュールのパイプラインを使用している。本稿では、画像から構成を直接予測するエンドツーエンドアプローチについて検討し、シーケンシャルアプローチのエラー蓄積を回避する。合成レンダリングされ、角度が限られている既存のデータセットとは対照的に、ChessReDはスマートフォンカメラを使ってさまざまな角度から撮影されている。 ChessReDのテスト画像の15.26%で、チェスのピースの構成を認識することに成功した。
論文参考訳（メタデータ） (2023-10-06T08:30:20Z)
Statistical analysis of chess games: space control and tipping points [0.0]
まず,空間特性と駒の位置に着目し,ゲーム中の移動回数が結果と正の相関関係にあることを示す。次に、部品のヒートマップを研究し、その空間分布が、エンジン(例えば、ストックフィッシュ)よりも人間のプレイヤー間では変化しないことを示す。
論文参考訳（メタデータ） (2023-04-22T14:54:34Z)
Representation Learning for General-sum Low-rank Markov Games [63.119870889883224]
非線形関数近似を用いたマルチエージェント汎用マルコフゲームについて検討する。遷移行列が未知の非線形表現の上に隠れた低ランク構造を持つ低ランクマルコフゲームに焦点を当てる。
論文参考訳（メタデータ） (2022-10-30T22:58:22Z)
There is no Accuracy-Interpretability Tradeoff in Reinforcement Learning for Mazes [64.05903267230467]
相互理解性は,強化学習システムにおける信頼性に不可欠なビルディングブロックである。場合によっては、最適性を保ちつつ、政策の解釈可能性を達成することができることを示す。
論文参考訳（メタデータ） (2022-06-09T04:23:26Z)
Towards General Function Approximation in Zero-Sum Markov Games [126.58493169301012]
本稿では,同時移動を伴う2プレーヤゼロサム有限ホライゾンマルコフゲームについて考察する。分離された設定とコーディネートされた設定の両方の効率的なアルゴリズムが開発されている。
論文参考訳（メタデータ） (2021-07-30T15:25:13Z)
Determining Chess Game State From an Image [19.06796946564999]
本稿では,既存のモデルよりも桁違いに大きい3次元モデルから合成した新しいデータセットについて述べる。従来のコンピュータビジョン技術とディープラーニングを組み合わせた新しいエンドツーエンドチェス認識システムを紹介します。記述されたシステムでは,テストセット上での誤差率は0.23%であり,現状の28倍である。
論文参考訳（メタデータ） (2021-04-30T13:02:13Z)
Almost Optimal Algorithms for Two-player Markov Games with Linear Function Approximation [92.99933928528797]
同時動作による2プレイヤーゼロサムマルコフゲームの強化学習について検討した。我々は,「不確かさの最適性」に基づくアルゴリズムナッシュ-UCRL-VTRを提案する。我々は、Nash-UCRL-VTR が $tildeO(dHsqrtT)$ regret を確実に達成できることを示し、$d$ は線型関数次元である。
論文参考訳（メタデータ） (2021-02-15T09:09:16Z)
Playing Chess with Limited Look Ahead [0.0]
静的評価関数として機能するために、ディープニューラルネットワークをトレーニングする。我々は,我々の静的評価関数が,先見的な知識をコード化していることを示す。先見深度に厳格な制限があるにもかかわらず、我々のエンジンはサンプル位置の約83%で同等の強度の移動を推奨している。
論文参考訳（メタデータ） (2020-07-04T16:02:43Z)
Near-Optimal Reinforcement Learning with Self-Play [50.29853537456737]
我々は,直接の監督なしに自己対決で最適な政策を学習するセルフプレイアルゴリズムに焦点をあてる。本稿では,サンプル複雑性を$tildemathcalO(SAB)$,サンプル複雑性を$tildemathcalO(S(A+B)$とする新しいemphNash Vラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-06-22T05:00:13Z)
Learning Zero-Sum Simultaneous-Move Markov Games Using Function Approximation and Correlated Equilibrium [116.56359444619441]
両プレイヤーのゼロサム有限ホライゾンマルコフゲームに対する効率の良い強化学習アルゴリズムを開発した。オフライン環境では、両プレイヤーを制御し、双対性ギャップを最小化してナッシュ平衡を求める。オンライン環境では、任意の相手と対戦する1人のプレイヤーを制御し、後悔を最小限に抑える。
論文参考訳（メタデータ） (2020-02-17T17:04:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。