論文の概要: Logic-based AI for Interpretable Board Game Winner Prediction with
Tsetlin Machine
- arxiv url: http://arxiv.org/abs/2203.04378v1
- Date: Tue, 8 Mar 2022 20:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 07:21:08.188106
- Title: Logic-based AI for Interpretable Board Game Winner Prediction with
Tsetlin Machine
- Title(参考訳): Tsetlin Machineを用いたボードゲーム勝者予測のための論理型AI
- Authors: Charul Giri, Ole-Christoffer Granmo, Herke van Hoof, Christian D.
Blakely
- Abstract要約: 本稿では,ボードゲームポジションの獲得と敗戦を記述した命題論理式を提案する。
我々は、以前にプレイされたゲームからこれらの表現を学習するために、Tsetlin Machine (TM) を使用している。
平均して、TMテストの精度は92.1%であり、他の評価アルゴリズムよりも優れている。
- 参考スコア(独自算出の注目度): 23.83480738752374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hex is a turn-based two-player connection game with a high branching factor,
making the game arbitrarily complex with increasing board sizes. As such,
top-performing algorithms for playing Hex rely on accurate evaluation of board
positions using neural networks. However, the limited interpretability of
neural networks is problematic when the user wants to understand the reasoning
behind the predictions made. In this paper, we propose to use propositional
logic expressions to describe winning and losing board game positions,
facilitating precise visual interpretation. We employ a Tsetlin Machine (TM) to
learn these expressions from previously played games, describing where pieces
must be located or not located for a board position to be strong. Extensive
experiments on $6\times6$ boards compare our TM-based solution with popular
machine learning algorithms like XGBoost, InterpretML, decision trees, and
neural networks, considering various board configurations with $2$ to $22$
moves played. On average, the TM testing accuracy is $92.1\%$, outperforming
all the other evaluated algorithms. We further demonstrate the global
interpretation of the logical expressions and map them down to particular board
game configurations to investigate local interpretability. We believe the
resulting interpretability establishes building blocks for accurate assistive
AI and human-AI collaboration, also for more complex prediction tasks.
- Abstract(参考訳): hexはターンベースの2プレイヤー接続ゲームであり、分岐係数が高く、ボードサイズが大きくなると任意に複雑になる。
したがって、hexをプレイするためのトップパフォーマンスアルゴリズムは、ニューラルネットワークを用いたボード位置の正確な評価に依存している。
しかし、ユーザが予測の背後にある理由を理解したい場合、ニューラルネットワークの限定的な解釈性は問題となる。
本稿では,提案する論理式を用いて,ボードゲームの位置の獲得と喪失を記述し,正確な視覚的解釈を容易にすることを提案する。
以前プレイしたゲームからこれらの表現を学ぶために,tsetlin machine (tm) を使用して,ボードの位置が強くなるために,駒の位置や位置を記述した。
6ドルのボードに関する大規模な実験は、TMベースのソリューションと、XGBoost、InterpretML、決定木、ニューラルネットワークといった一般的な機械学習アルゴリズムを比較し、さまざまなボード構成を2ドルから22ドルの動きで検討している。
平均して、TMテストの精度は92.1 %$であり、他の評価アルゴリズムよりも優れている。
さらに、論理式をグローバルに解釈し、それを特定のボードゲーム構成にマップし、局所的な解釈可能性を調べる。
我々は、その結果の解釈可能性によって、より複雑な予測タスクのために、正確なAIと人間とAIのコラボレーションのためのビルディングブロックが確立されると考えている。
関連論文リスト
- Denoising Opponents Position in Partial Observation Environment [0.4660328753262075]
サッカーシミュレーション2D (SS2D) では、11人の選手と1人のコーチを含む2チームが対戦する。
我々は,Long Short-Term Memory Model (LSTM) とDeep Neural Networks (DNN) を用いた位置予測のアイデアを説明する。
論文 参考訳(メタデータ) (2023-10-23T04:16:52Z) - Representation Learning for General-sum Low-rank Markov Games [63.119870889883224]
非線形関数近似を用いたマルチエージェント汎用マルコフゲームについて検討する。
遷移行列が未知の非線形表現の上に隠れた低ランク構造を持つ低ランクマルコフゲームに焦点を当てる。
論文 参考訳(メタデータ) (2022-10-30T22:58:22Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Dual Lottery Ticket Hypothesis [71.95937879869334]
Lottery Ticket hypothesis (LTH)は、スパースネットワークトレーニングを調査し、その能力を維持するための新しい視点を提供する。
本稿では,LTHの当選チケットをトレーニング可能なサブネットワークとして,その性能をベンチマークとして検討する。
本稿では,簡単なスパースネットワークトレーニング戦略であるランダムスパースネットワークトランスフォーメーション(RST)を提案し,DLTHを裏付ける。
論文 参考訳(メタデータ) (2022-03-08T18:06:26Z) - Near-Optimal Learning of Extensive-Form Games with Imperfect Information [54.55092907312749]
本稿では,2プレイヤーゼロサムゲームにおいて,$widetildemathcalO((XA+YB)/varepsilon2)$プレイのエピソードのみを必要とするアルゴリズムの最初の行を,$varepsilon$-approximate Nash平衡を求める。
これにより$widetildemathcalO((X2A+Y2B)/varepsilon2)$が$widetildemathcalO(maxX,
論文 参考訳(メタデータ) (2022-02-03T18:18:28Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Discovering Multi-Agent Auto-Curricula in Two-Player Zero-Sum Games [31.97631243571394]
明示的な人間設計なしに更新ルールの発見を自動化するフレームワークであるLMACを導入する。
意外なことに、人間のデザインがなくても、発見されたMARLアルゴリズムは競争力や性能が向上する。
LMAC は,例えば Kuhn Poker のトレーニングやPSRO の成績など,小型ゲームから大規模ゲームへの一般化が可能であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:30:25Z) - Evolving Evaluation Functions for Collectible Card Game AI [1.370633147306388]
本研究は,機能ベースゲーム評価機能の進化における2つの重要な側面について述べる。
ゲノム表現の選択とモデルをテストするために使用される相手の選択について検討した。
私たちは、戦略カードゲームAIコンペティションで使用されるプログラミングゲーム、Regends of Code and Magicで実験をエンコードしました。
論文 参考訳(メタデータ) (2021-05-03T18:39:06Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Regret Minimization in Stochastic Contextual Dueling Bandits [40.17224226373741]
我々は、コンテキスト設定において、$K$武装デュエルバンディットの問題を考察する。
提案手法は, それぞれ, 後悔の保証を施した2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-20T06:36:19Z) - Learning Zero-Sum Simultaneous-Move Markov Games Using Function
Approximation and Correlated Equilibrium [116.56359444619441]
両プレイヤーのゼロサム有限ホライゾンマルコフゲームに対する効率の良い強化学習アルゴリズムを開発した。
オフライン環境では、両プレイヤーを制御し、双対性ギャップを最小化してナッシュ平衡を求める。
オンライン環境では、任意の相手と対戦する1人のプレイヤーを制御し、後悔を最小限に抑える。
論文 参考訳(メタデータ) (2020-02-17T17:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。