論文の概要: AI-powered tiebreak mechanisms: An application to chess
- arxiv url: http://arxiv.org/abs/2210.08289v1
- Date: Sat, 15 Oct 2022 13:27:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 20:39:34.929077
- Title: AI-powered tiebreak mechanisms: An application to chess
- Title(参考訳): AIによるタイブレーク機構:チェスへの応用
- Authors: Nejat Anbarci and Mehmet S. Ismail
- Abstract要約: 我々は,チェスなどのゲームにおける引き分けやトーナメントにおけるタイの場合に,AIシステムが審査員として機能することを提案する。
我々は,nドル対人ゼロサムゲームにおいて,AIに基づくスコアリング機構のファミリーと「ティーブレイク戦略の安全性」の概念を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose that AI systems serve as a judge in the event of a
draw in games such as chess and in the event of a tie in tournaments. More
specifically, we introduce a family of AI-based scoring mechanisms and the
concept of "tiebreak strategyproofness" in $n$-person zero-sum games. A
mechanism is called tiebreak strategyproof (TSP) if it is always in the best
interest of every player to choose the "best" action according to a given AI
system. As such, we introduce a practicable scoring mechanism in chess and show
that it is TSP, i.e., it is never in the interest of a player to deliberately
play a worse move to increase their advantage in case the game goes to the
tiebreak. In other words, TSP mechanisms are immune to such strategic
manipulations. We also show that the current "speed-chess" tiebreaks are not
TSP or immune to manipulation with an example from 2018 world chess
championship between Carlsen and Caruana.
- Abstract(参考訳): 本稿では,チェスなどのゲームにおける引き分けやトーナメントにおけるタイの場合において,AIシステムが審査役を務めることを提案する。
より具体的には、n$-person zero-sumゲームにおいて、aiベースのスコアリングメカニズムと「タイブレイク戦略耐性」の概念を導入する。
メカニズムをtiebreak strategyproof(tsp)と呼ぶのは、与えられたaiシステムに従って「最高の」アクションを選択することが、すべてのプレイヤーにとって常に最善の利益である場合である。
そこで,本研究では,チェスにおいて実践可能なスコアリング機構を導入し,tsp,すなわち,ゲームがタイブレイクに到達した場合のアドバンテージを高めるために,より悪質な動きを故意に行うことに関心がないことを示す。
言い換えれば、TSP機構はそのような戦略的操作に免疫を持つ。
また、現在の「スピードチェイス」タイブレークは、カルセンとカルアナの2018年の世界チェス選手権の例で、TSPや操作に免疫がないことも示しています。
関連論文リスト
- Generalised agent for solving higher board states of tic tac toe using
Reinforcement Learning [0.0]
本研究の目的は, 短時間で正確な移動を行うため, 高位板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板状板
そのアイデアは、よく考えられた学習問題として、ティック・タック・トイ・ゲーム(tic tac toe game)を取り入れることだ。
研究とその成果は有望であり、トレーニングの各エポックに比例して高い勝利を与える。
論文 参考訳(メタデータ) (2022-12-23T10:58:27Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - Adversarial Policies Beat Superhuman Go AIs [54.15639517188804]
我々は,現在最先端の囲碁AIシステムであるKataGoを,敵の政策を訓練することによって攻撃する。
敵は囲碁を上手に弾くことで勝てない。かたごを騙して真剣な失敗を犯す。
我々の結果は、超人的AIシステムでさえ、驚くほどの障害モードを持っていることを実証している。
論文 参考訳(メタデータ) (2022-11-01T03:13:20Z) - Mastering the Game of Stratego with Model-Free Multiagent Reinforcement
Learning [86.37438204416435]
Strategoは、人工知能(AI)がまだマスターしていない数少ない象徴的なボードゲームの一つだ。
ストラテゴにおける決定は、行動と結果の間に明らかな結びつきがなく、多数の個別の行動に対してなされる。
DeepNashは、ストラテゴの既存の最先端AIメソッドを破り、Gravonゲームプラットフォームで年間(2022年)と最高3位を達成した。
論文 参考訳(メタデータ) (2022-06-30T15:53:19Z) - Measuring the Non-Transitivity in Chess [19.618609913302855]
我々は、人間のプレイヤーの実際のデータを通してチェスの非透過性を定量化する。
非透過性の度合いとチェス選手のレーティングの進行との間には強いつながりがある。
論文 参考訳(メタデータ) (2021-10-22T12:15:42Z) - Collaborative Agent Gameplay in the Pandemic Board Game [3.223284371460913]
Pandemicは、すべてのプレイヤーがゲームの進行中に発生する出来事によって引き起こされる課題を克服するために調整する模範的な共同ボードゲームです。
本稿では,すべてのプレイヤーの行動を制御し,この高度に進化した環境において勝つ確率と負けるリスクをバランスさせる人工エージェントを提案する。
提案アルゴリズムは,様々な難易度を持つ異なるゲームにおいて,より一貫した勝利戦略を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-03-21T13:18:20Z) - LiveChess2FEN: a Framework for Classifying Chess Pieces based on CNNs [0.0]
我々は,1秒未満で画像からチェス位置を自動的にデジタル化する機能的フレームワークを実装した。
チェスの駒の分類と組込みプラットフォーム上で効率的にマップする方法について、さまざまな畳み込みニューラルネットワークを分析した。
論文 参考訳(メタデータ) (2020-12-12T16:48:40Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets
in Chess [5.3524101179510595]
私たちはAlphaZeroを使って、新しいチェスの変種を創造的に探索し、設計しています。
チェスのルールに原子的変化を含む他の9つの変種を比較した。
AlphaZeroを用いて各変種に対する準最適戦略を学習することにより、これらの変種が採用された場合、強い人間プレイヤー間のゲームがどのように見えるかを決定する。
論文 参考訳(メタデータ) (2020-09-09T15:49:14Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Provable Self-Play Algorithms for Competitive Reinforcement Learning [48.12602400021397]
我々はマルコフゲームの設定の下で、競争力強化学習における自己プレイについて研究する。
自己再生アルゴリズムは、ゲームのT$ステップをプレイした後、後悔の$tildemathcalO(sqrtT)$を達成する。
また, 最悪の場合においても, 時間内に実行可能であることを保証し, 若干悪い後悔を招き, エクスプロイトスタイルのアルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-02-10T18:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。