論文の概要: Knowledge-Based Paranoia Search in Trick-Taking
- arxiv url: http://arxiv.org/abs/2104.05423v1
- Date: Wed, 7 Apr 2021 09:12:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 19:42:22.522219
- Title: Knowledge-Based Paranoia Search in Trick-Taking
- Title(参考訳): トリックテイクにおける知識に基づくパラノイア探索
- Authors: Stefan Edelkamp
- Abstract要約: 本稿では,カードゲームSkatのトリックテイク中に強制的な勝利を見つけるために,emphknowledge-based paraonoia search (KBPS)を提案する。
ゲームツリーの効率的な部分情報検索と知識表現と推論を組み合わせる。
- 参考スコア(独自算出の注目度): 1.3706331473063877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes \emph{knowledge-based paraonoia search} (KBPS) to find
forced wins during trick-taking in the card game Skat; for some one of the most
interesting card games for three players. It combines efficient partial
information game-tree search with knowledge representation and reasoning. This
worst-case analysis, initiated after a small number of tricks, leads to a
prioritized choice of cards. We provide variants of KBPS for the declarer and
the opponents, and an approximation to find a forced win against most worlds in
the belief space. Replaying thousands of expert games, our evaluation indicates
that the AIs with the new algorithms perform better than humans in their play,
achieving an average score of over 1,000 points in the agreed standard for
evaluating Skat tournaments, the extended Seeger system.
- Abstract(参考訳): 本稿では,カードゲーム『Skat』のトリックテイクにおいて,最も興味深いカードゲームの一つとして,KBPS(emph{knowledge-based paraonoia search})を提案する。
効率的な部分情報ゲームツリー探索と知識表現と推論を組み合わせる。
この最悪のケース分析は、少数のトリックの後に始まり、優先順位付けされたカードの選択につながる。
我々は宣言者および反対者に対してKBPSの変種を提供し、信念空間のほとんどの世界に対して強制的な勝利を求める近似を与える。
何千もの専門的なゲームを再現することにより、新しいアルゴリズムを持つAIは、プレイにおいて人間よりも優れたパフォーマンスを示し、Skatトーナメント、拡張シーガーシステムにおいて、合意された基準で平均1000点以上のスコアを達成している。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - AlphaZero Gomoku [9.434566356382529]
我々は、AlphaZeroを「Five in a Row」とも呼ばれる古くからのボードゲーム「Gomoku」に拡張する。
我々のテストは、Go以外のゲームに適応するAlphaZeroの汎用性を示している。
論文 参考訳(メタデータ) (2023-09-04T00:20:06Z) - Targeted Search Control in AlphaZero for Effective Policy Improvement [93.30151539224144]
我々はAlphaZeroの新しい検索制御戦略であるGo-Exploitを紹介する。
Go-Exploitは、関心のある状態のアーカイブからセルフプレイトラジェクトリの開始状態をサンプリングする。
Go-Exploitは、標準のAlphaZeroよりも優れたサンプル効率で学習する。
論文 参考訳(メタデータ) (2023-02-23T22:50:24Z) - Optimisation of MCTS Player for The Lord of the Rings: The Card Game [0.0]
本稿では,モンテカルロツリーサーチ(MCTS)手法を用いて,人気カードゲーム「指輪のロード」の人工プレイヤーを作成する研究について述べる。
論文 参考訳(メタデータ) (2021-09-24T14:42:32Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - On the Power of Refined Skat Selection [1.3706331473063877]
Skatは魅力的なカードゲームで、現代のAIシステムの本質的な課題の多くを示しています。
洗練されたskat評価機能に基づくハードエキスパートルールとスコアリング関数を提案する。
実験では、精巧なskat pingアルゴリズムがボットの演奏性能に与える影響を強調した。
論文 参考訳(メタデータ) (2021-04-07T08:54:58Z) - Collaborative Agent Gameplay in the Pandemic Board Game [3.223284371460913]
Pandemicは、すべてのプレイヤーがゲームの進行中に発生する出来事によって引き起こされる課題を克服するために調整する模範的な共同ボードゲームです。
本稿では,すべてのプレイヤーの行動を制御し,この高度に進化した環境において勝つ確率と負けるリスクをバランスさせる人工エージェントを提案する。
提案アルゴリズムは,様々な難易度を持つ異なるゲームにおいて,より一貫した勝利戦略を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-03-21T13:18:20Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Multi-Armed Bandits for Minesweeper: Profiting from
Exploration-Exploitation Synergy [0.0]
人気のコンピュータパズルであるマインズウィーパーのゲームでは、人間のプレイヤーは幸運と戦略の両方を混ぜて成功させる必要がある。
我々は,このゲームで提示される問題に対処するために,強化学習に基づく新しい方法論を開発する。
論文 参考訳(メタデータ) (2020-07-25T01:44:50Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。