論文の概要: StarAI: Reducing incompleteness in the game of Bridge using PLP
- arxiv url: http://arxiv.org/abs/2001.08193v1
- Date: Wed, 22 Jan 2020 18:27:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 18:41:16.885934
- Title: StarAI: Reducing incompleteness in the game of Bridge using PLP
- Title(参考訳): StarAI:PLPを用いたブリッジゲームにおける不完全性低減
- Authors: J Li, S Thepaut, V Ventos
- Abstract要約: ブリッジはトリックテイクカードゲームであり、各プレイヤーがカードを見るだけである。
戦略を選択するためには、プレイヤーが他のプレイヤーの手に隠されたカードに関する情報を集める必要がある。
本稿では,確率論理プログラミングを用いてブリッジにおけるカードプレイの一部をモデル化する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bridge is a trick-taking card game requiring the ability to evaluate
probabilities since it is a game of incomplete information where each player
only sees its cards. In order to choose a strategy, a player needs to gather
information about the hidden cards in the other players' hand. We present a
methodology allowing us to model a part of card playing in Bridge using
Probabilistic Logic Programming.
- Abstract(参考訳): ブリッジは、各プレイヤーがカードのみを見る不完全な情報のゲームであるため、確率を評価する能力を必要とするトリックテイクカードゲームである。
戦略を選択するためには、プレイヤーが他のプレイヤーの手に隠されたカードに関する情報を集める必要がある。
本稿では,確率的論理プログラミングを用いてカードプレイの一部をブリッジでモデル化する手法を提案する。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Learning With Generalised Card Representations for "Magic: The Gathering" [4.336779198334903]
この研究は、見えないカードに一般化するカード表現の可能性を探る。
本研究では,カードの数値的,名目的,テキスト的特徴に基づく表現,カードイメージ,およびサードパーティサービスからのカード使用状況に関するメタ情報について検討する。
その結果, 一般化された入力表現の特定の選択は, 既知のカード間の人間のカード選択を予測する学習にはほとんど影響を及ぼさないが, 新たな未知のカードの性能は大幅に向上できることがわかった。
論文 参考訳(メタデータ) (2024-07-08T12:42:44Z) - Closed Drafting as a Case Study for First-Principle Interpretability,
Memory, and Generalizability in Deep Reinforcement Learning [3.018656336329545]
本稿では,DQN(Deep Q-Network)モデルの解釈可能性,一般化性,メモリについて検討する。
我々は、最先端の演技を行う「寿司囲碁会」と呼ばれる、クローズドドラフトゲームの人気ファミリを使用している。
論文 参考訳(メタデータ) (2023-10-31T17:24:40Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Principal Trade-off Analysis [79.16635054977068]
低次元特徴空間にゲームを埋め込む分解法であるPTA(Principal Trade-off Analysis)を示す。
PTAは2次元特徴平面の対の重み付け和として任意の2-player 0-sumゲームを表す。
ゲーム四重奏におけるPTAの有効性を示す(Kuhn poker, RPS+2, Blotto, Pokemon)。
論文 参考訳(メタデータ) (2022-06-09T18:16:28Z) - Optimisation of MCTS Player for The Lord of the Rings: The Card Game [0.0]
本稿では,モンテカルロツリーサーチ(MCTS)手法を用いて,人気カードゲーム「指輪のロード」の人工プレイヤーを作成する研究について述べる。
論文 参考訳(メタデータ) (2021-09-24T14:42:32Z) - Knowledge-Based Paranoia Search in Trick-Taking [1.3706331473063877]
本稿では,カードゲームSkatのトリックテイク中に強制的な勝利を見つけるために,emphknowledge-based paraonoia search (KBPS)を提案する。
ゲームツリーの効率的な部分情報検索と知識表現と推論を組み合わせる。
論文 参考訳(メタデータ) (2021-04-07T09:12:45Z) - On the Power of Refined Skat Selection [1.3706331473063877]
Skatは魅力的なカードゲームで、現代のAIシステムの本質的な課題の多くを示しています。
洗練されたskat評価機能に基づくハードエキスパートルールとスコアリング関数を提案する。
実験では、精巧なskat pingアルゴリズムがボットの演奏性能に与える影響を強調した。
論文 参考訳(メタデータ) (2021-04-07T08:54:58Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。