論文の概要: A Fast Algorithm for Computing the Deficiency Number of a Mahjong Hand
- arxiv url: http://arxiv.org/abs/2108.06832v1
- Date: Sun, 15 Aug 2021 22:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 00:54:12.050219
- Title: A Fast Algorithm for Computing the Deficiency Number of a Mahjong Hand
- Title(参考訳): 麻雀の手の不足数を計算するための高速アルゴリズム
- Authors: Xueqing Yan, Yongming Li, Sanjiang Li
- Abstract要約: タイルベースのマルチプレイヤーゲーム「Mahjong」はアジアで広くプレイされており、世界中で人気が高まっている。
マヒョンの重要な概念は、手の不備数(すなわち、マヒョンにおけるシャンテン数)であり、勝手を完成させるためにどれだけのタイル変更が必要かを推定するものである。
本稿では,Mahjongハンドの不足数を高速に計算するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 13.48957726008272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The tile-based multiplayer game Mahjong is widely played in Asia and has also
become increasingly popular worldwide. Face-to-face or online, each player
begins with a hand of 13 tiles and players draw and discard tiles in turn until
they complete a winning hand. An important notion in Mahjong is the deficiency
number (a.k.a. shanten number in Japanese Mahjong) of a hand, which estimates
how many tile changes are necessary to complete the hand into a winning hand.
The deficiency number plays an essential role in major decision-making tasks
such as selecting a tile to discard. This paper proposes a fast algorithm for
computing the deficiency number of a Mahjong hand. Compared with the baseline
algorithm, the new algorithm is usually 100 times faster and, more importantly,
respects the agent's knowledge about available tiles. The algorithm can be used
as a basic procedure in all Mahjong variants by both rule-based and machine
learning-based Mahjong AI.
- Abstract(参考訳): タイルベースのマルチプレイヤーゲームMahjongはアジアで広くプレイされており、世界中で人気が高まっている。
対面またはオンラインでは、各プレイヤーは13のタイルの手で始まり、プレイヤーは勝利の手を完了するまで順番にタイルを描き捨てる。
mahjong の重要な概念は不足数 (a.k.a.) である。
手(ひょうてん)は、手が勝ち手になるのに必要なタイルの変化の数を算定する手である。
欠陥数は、破棄するタイルを選択するなどの主要な意思決定タスクにおいて重要な役割を果たす。
本稿では,Mahjongハンドの不足数を高速に計算するアルゴリズムを提案する。
ベースラインアルゴリズムと比較して、新しいアルゴリズムは通常100倍速く、さらに重要なのは、利用可能なタイルに関するエージェントの知識を尊重する。
このアルゴリズムはルールベースと機械学習ベースのMahjong AIによって、すべてのMahjong変種の基本手順として使用できる。
関連論文リスト
- CFR-p: Counterfactual Regret Minimization with Hierarchical Policy
Abstraction, and its Application to Two-player Mahjong [2.741266294612776]
ゲーム理論解析を行い、勝利ポリシーに基づいてCFRに階層的な抽象化を施すことにより、2人のプレイヤー・マヒョンについて研究する。
このフレームワークは、他の不完全な情報ゲームに一般化することができる。
論文 参考訳(メタデータ) (2023-07-22T14:38:47Z) - The Update-Equivalence Framework for Decision-Time Planning [78.44953498421854]
本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-04-25T20:28:55Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Mastering Strategy Card Game (Hearthstone) with Improved Techniques [8.399453146308502]
戦略カードゲームはインテリジェントなゲームプレイを必要としており、AIにとって理想的なテストベンチになり得る。
これまでの仕事は、エンドツーエンドのポリシー機能と楽観的なスムーズな架空の遊びを組み合わせたものだった。
本研究では,ゲームルールや機構が複雑である有名な商用ゲームであるHerthstoneに対して,そのようなアルゴリズムを適用する。
論文 参考訳(メタデータ) (2023-03-09T11:52:52Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - Building a 3-Player Mahjong AI using Deep Reinforcement Learning [9.603486077267693]
我々は,深層強化学習を用いたサンマのAIであるMeowjongを紹介する。
Meowjongのモデルは、4人のMahjongのAIに匹敵するテスト精度を達成する。
Sanmaで最初のAIである私たちは、Meowjongがこのゲームの最先端技術であると主張している。
論文 参考訳(メタデータ) (2022-02-25T17:41:43Z) - On the complexity of Dark Chinese Chess [5.019685897194575]
ダーク・チャイニーズ・チェスはボードゲームとカードゲームでもっとも複雑な要素を組み合わせている。
本報告では,暗黒中国チェスのゲームにおける複雑性解析について述べる。
論文 参考訳(メタデータ) (2021-12-06T13:08:53Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - TotalBotWar: A New Pseudo Real-time Multi-action Game Challenge and
Competition for AI [62.997667081978825]
TotalBotWarは、ゲームAIのための新しい擬似リアルタイムマルチアクションチャレンジだ。
ゲームはTotalWarのゲームシリーズに基づいており、プレイヤーは敵のゲームに勝つために軍隊を管理する。
論文 参考訳(メタデータ) (2020-09-18T09:13:56Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。