論文の概要: Measuring the Non-Transitivity in Chess
- arxiv url: http://arxiv.org/abs/2110.11737v1
- Date: Fri, 22 Oct 2021 12:15:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 15:31:52.030266
- Title: Measuring the Non-Transitivity in Chess
- Title(参考訳): チーズの非遷移度測定
- Authors: Ricky Sanjaya, Jun Wang, Yaodong Yang
- Abstract要約: 我々は、人間のプレイヤーの実際のデータを通してチェスの非透過性を定量化する。
非透過性の度合いとチェス選手のレーティングの進行との間には強いつながりがある。
- 参考スコア(独自算出の注目度): 19.618609913302855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It has long been believed that Chess is the \emph{Drosophila} of Artificial
Intelligence (AI). Studying Chess can productively provide valid knowledge
about complex systems. Although remarkable progress has been made on solving
Chess, the geometrical landscape of Chess in the strategy space is still
mysterious. Judging on AI-generated strategies, researchers hypothesised that
the strategy space of Chess possesses a spinning top geometry, with the upright
axis representing the \emph{transitive} dimension (e.g., A beats B, B beats C,
A beats C), and the radial axis representing the \emph{non-transitive}
dimension (e.g., A beats B, B beats C, C beats A). However, it is unclear
whether such a hypothesis holds for real-world strategies. In this paper, we
quantify the non-transitivity in Chess through real-world data from human
players. Specifically, we performed two ways of non-transitivity
quantifications -- Nash Clustering and counting the number of
Rock-Paper-Scissor cycles -- on over one billion match data from Lichess and
FICS. Our findings positively indicate that the strategy space occupied by
real-world Chess strategies demonstrates a spinning top geometry, and more
importantly, there exists a strong connection between the degree of
non-transitivity and the progression of a Chess player's rating. In particular,
high degrees of non-transitivity tend to prevent human players from making
progress on their Elo rating, whereas progressions are easier to make at the
level of ratings where the degree of non-transitivity is lower. Additionally,
we also investigate the implication of the degree of non-transitivity for
population-based training methods. By considering \emph{fixed-memory Fictitious
Play} as a proxy, we reach the conclusion that maintaining large-size and
diverse populations of strategies is imperative to training effective AI agents
in solving Chess types of games.
- Abstract(参考訳): チェスは人工知能(AI)のemph{Drosophila}であると長い間信じられてきた。
チェスの研究は複雑なシステムに関する有効な知識を生産的に提供することができる。
チェスの解決には目覚ましい進歩があったが、戦略空間におけるチェスの幾何学的景観はまだ謎のままである。
aiが生成した戦略に基づいて、研究者はチェスの戦略空間が回転するトップ幾何学を持ち、直立軸は \emph{transitive} 次元(例えば、a beats b, b beats c, a beats c)を、半径軸は \emph{non-transitive} 次元(例えば a beats b, b beats c, c beats a)をそれぞれ持つと仮定した。
しかし、そのような仮説が現実世界の戦略に当てはまるかどうかは不明である。
本稿では,チェスにおける非推移性を,人間プレイヤーによる実世界データを用いて定量化する。
具体的には、LichessとFICSの10億以上のマッチングデータ(Nash Clustering)とRock-Paper-Scissorサイクルの数をカウントする2つの方法を実行しました。
本研究は,実世界のチェス戦略が占める戦略空間がスピントップ幾何学を示し,より重要なこととして,非推移性の程度とチェス選手のレーティングの進行との間に強い関係があることを示す。
特に、高レベルの非推移性は、人間プレイヤーがエロレーティングの進歩を妨げやすい傾向にあり、一方、進行は、非推移性の度合いが低いレーティングのレベルでの進行が容易である。
また,人口ベーストレーニング手法における非推移度の影響についても検討した。
プロキシとして \emph{fixed-Memory Fictitious Play} を考慮することで,Chessタイプのゲームを解決する上で,大規模かつ多様な戦略戦略の維持が効果的なAIエージェントのトレーニングに不可欠である,という結論に達した。
関連論文リスト
- Explore the Reasoning Capability of LLMs in the Chess Testbed [45.12891789312405]
我々は,注釈付き戦略と戦術を統合することで,チェスにおける大規模言語モデルの推論能力を向上させることを提案する。
我々はLLaMA-3-8Bモデルを微調整し、より優れたチェスの動きを選択するタスクにおいて、最先端の商用言語モデルと比較する。
論文 参考訳(メタデータ) (2024-11-11T01:42:56Z) - Predicting Chess Puzzle Difficulty with Transformers [0.0]
GlickFormerは,Glicko-2レーティングシステムを用いて,チェスパズルの難易度を予測するトランスフォーマーアーキテクチャである。
提案モデルでは,空間的特徴抽出にChessFormerのバックボーンを改良し,分解変換技術を用いて時間情報を組み込んだ。
結果は、GlickFormerのパフォーマンスが、最先端のChessFormerベースラインと比較して、複数のメトリクスにわたって優れていることを示している。
論文 参考訳(メタデータ) (2024-10-14T20:39:02Z) - Predicting User Perception of Move Brilliance in Chess [3.434553688053531]
チェスの動きを華々しく分類する最初のシステムを示す。
精度は79%(ベースレート50%)、PPVは83%、NPVは75%である。
より弱いエンジンが低品質とみなすと、この動きは輝かしく、すべて等しいと予測される傾向が示される。
論文 参考訳(メタデータ) (2024-06-14T17:46:26Z) - Amortized Planning with Large-Scale Transformers: A Case Study on Chess [11.227110138932442]
本稿では,AIにおける画期的な計画問題であるチェスを用いて,計画課題の性能評価を行う。
ChessBenchは、Stockfishが提供する法的行動と価値アノテーション(1500億ポイント)を備えた1000万のチェスゲームの大規模なベンチマークである。
極めて優れた近似を教師付き学習により大規模変圧器に蒸留することは可能であるが, 完全蒸留は依然として到達範囲を超えている。
論文 参考訳(メタデータ) (2024-02-07T00:36:24Z) - Learning to Play Chess from Textbooks (LEAP): a Corpus for Evaluating
Chess Moves based on Sentiment Analysis [4.314956204483074]
本稿では,チェスの遊び方を学ぶための新しい知識源として,チェスの教科書について検討する。
我々はLEAPコーパスを開発した。LEAPコーパスは、構造化された(記法やボード状態を動かす)構造付きおよび非構造化データを備えた、最初の、そして新しい異種データセットである。
感情分析のための各種変圧器ベースラインモデルの性能評価実験を行った。
論文 参考訳(メタデータ) (2023-10-31T08:26:02Z) - Intransitively winning chess players positions [91.3755431537592]
チェス選手の位置の勝利の間の関係の空間はユークリッドではない。
ツェルメロ・ヴォン・ノイマンの定理は、純粋な勝利戦略を構築する可能性と不可能性についての言明によって補完される。
論文 参考訳(メタデータ) (2022-12-11T05:55:05Z) - Mastering the Game of Stratego with Model-Free Multiagent Reinforcement
Learning [86.37438204416435]
Strategoは、人工知能(AI)がまだマスターしていない数少ない象徴的なボードゲームの一つだ。
ストラテゴにおける決定は、行動と結果の間に明らかな結びつきがなく、多数の個別の行動に対してなされる。
DeepNashは、ストラテゴの既存の最先端AIメソッドを破り、Gravonゲームプラットフォームで年間(2022年)と最高3位を達成した。
論文 参考訳(メタデータ) (2022-06-30T15:53:19Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets
in Chess [5.3524101179510595]
私たちはAlphaZeroを使って、新しいチェスの変種を創造的に探索し、設計しています。
チェスのルールに原子的変化を含む他の9つの変種を比較した。
AlphaZeroを用いて各変種に対する準最適戦略を学習することにより、これらの変種が採用された場合、強い人間プレイヤー間のゲームがどのように見えるかを決定する。
論文 参考訳(メタデータ) (2020-09-09T15:49:14Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。