論文の概要: The Winnability of Klondike Solitaire and Many Other Patience Games
- arxiv url: http://arxiv.org/abs/1906.12314v5
- Date: Sat, 31 Aug 2024 16:47:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-04 23:20:48.088521
- Title: The Winnability of Klondike Solitaire and Many Other Patience Games
- Title(参考訳): Klondike Solitaireとその他多くのPetience Gamesの勝利
- Authors: Charlie Blake, Ian P. Gent,
- Abstract要約: ソリティアカードゲーム「クロンダイク」の勝利率の無知は、「応用数学の恥ずかしさの1つ」と評されている。
ここでは、Solvitaire'という単一の汎用人工知能プログラムを用いて、95%の信頼区間+/-0.1%以上を有する35種類のシングルプレイヤーカードゲームにおいて、73種類の勝利率を決定できることを示す。
- 参考スコア(独自算出の注目度): 1.2891210250935148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our ignorance of the winnability percentage of the solitaire card game `Klondike' has been described as "one of the embarrassments of applied mathematics". Klondike, the game in the Windows Solitaire program, is just one of many single-player card games, generically called 'patience' or 'solitaire' games, for which players have long wanted to know how likely a particular game is to be winnable. A number of different games have been studied empirically in the academic literature and by non-academic enthusiasts. Here we show that a single general purpose Artificial Intelligence program named `Solvitaire' can be used to determine the winnability percentage of 73 variants of 35 different single-player card games with a 95% confidence interval of +/- 0.1% or better. For example, we report the winnability of Klondike as 81.945%+/- 0.084% (in the `thoughtful' variant where the player knows the rank and suit of all cards), a 30-fold reduction in confidence interval over the best previous result. The vast majority of our results are either entirely new or represent significant improvements on previous knowledge.
- Abstract(参考訳): ソリティアカードゲーム『Klondike』の勝利率の無知は、「応用数学の恥ずかしさの1つ」と評されている。
Windows SolitaireプログラムのゲームであるKlondikeは、一般的な「パティエンス」または「ソリティア」ゲームと呼ばれる多くのシングルプレイヤーカードゲームのうちの1つである。
多くの異なるゲームが学術文学や非アカデミックな愛好家によって実証的に研究されている。
ここでは,Solvitaireという1つの汎用人工知能プログラムを用いて,95%の信頼区間+/-0.1%以上を有する35種類のシングルプレイヤーカードゲームにおいて,73種類の勝利率を決定できることを示す。
例えば、Klondikeの勝利率は81.945%+/-0.084%(プレイヤーがすべてのカードのランクとスーツを知っている「思慮深い」変種)と報告する。
結果の大部分は,まったく新しいものか,あるいは以前の知識を大幅に改善したものかのどちらかです。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Securing Equal Share: A Principled Approach for Learning Multiplayer Symmetric Games [21.168085154982712]
マルチプレイヤーゲームにおける平衡は、一意でも爆発的でもない。
本稿では,平等な共有という自然な目的に焦点をあてることで,これらの課題に対処するための最初の一歩を踏み出す。
我々は、様々な設定でほぼ同じシェアを確実に得る、非回帰学習にインスパイアされた、一連の効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-06-06T15:59:17Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Learning not to Regret [19.945846614714167]
特定の分布に合わせて最小限の後悔をメタ学習できる新しい「後悔しない学習」フレームワークを提案する。
我々の重要な貢献であるNeural Predictive Regret Matchingは、選択されたゲームの分布に対して急速に収束するようにメタ学習されています。
実験の結果,メタ学習アルゴリズムは非メタ学習アルゴリズムよりも優れ,10倍以上の改善が得られた。
論文 参考訳(メタデータ) (2023-03-02T08:56:12Z) - Predicting Winning Regions in Parity Games via Graph Neural Networks
(Extended Abstract) [68.8204255655161]
グラフニューラルネットワークを用いてパリティゲームの勝利領域を決定するための不完全時間的アプローチを提案する。
これは、データセットの60%の勝利領域を正しく決定し、残りの領域で小さなエラーしか発生しない。
論文 参考訳(メタデータ) (2022-10-18T15:10:25Z) - No-Regret Learning in Time-Varying Zero-Sum Games [99.86860277006318]
固定ゼロサムゲームにおける繰り返しプレイからの学習は、ゲーム理論とオンライン学習における古典的な問題である。
提案手法は,3つの性能基準の下で,良好な保証を同時に享受できる1つのパラメータフリーアルゴリズムである。
本アルゴリズムは,ある特性を満たすブラックボックスベースラーナー群に対するメタアルゴリズムを用いた2層構造に基づく。
論文 参考訳(メタデータ) (2022-01-30T06:10:04Z) - Public Information Representation for Adversarial Team Games [31.29335755664997]
対戦チームゲームは、プレイ中にチームメンバーが利用可能な非対称情報の中にあります。
本アルゴリズムは,対戦相手を持つ逐次チームゲームから古典的な2プレイヤーゼロサムゲームに変換する。
この問題のNPハード性のため、結果のパブリックチームゲームは元のゲームよりも指数関数的に大きいかもしれない。
論文 参考訳(メタデータ) (2022-01-25T15:07:12Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Knowledge-Based Paranoia Search in Trick-Taking [1.3706331473063877]
本稿では,カードゲームSkatのトリックテイク中に強制的な勝利を見つけるために,emphknowledge-based paraonoia search (KBPS)を提案する。
ゲームツリーの効率的な部分情報検索と知識表現と推論を組み合わせる。
論文 参考訳(メタデータ) (2021-04-07T09:12:45Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Tackling Morpion Solitaire with AlphaZero-likeRanked Reward
Reinforcement Learning [4.534822382040738]
Morpion Solitaireは、紙と鉛筆で演奏される人気シングルプレーヤーゲームである。
従来の検索アルゴリズムでは良い解が見つからなかった。
我々は、ランク付け報酬として知られるアプローチを使用して、Morpion Solitaireのための強化学習セルフプレイフレームワークを作成します。
論文 参考訳(メタデータ) (2020-06-14T18:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。