論文の概要: Playing the Player: A Heuristic Framework for Adaptive Poker AI
- arxiv url: http://arxiv.org/abs/2512.04714v1
- Date: Thu, 04 Dec 2025 12:01:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.150749
- Title: Playing the Player: A Heuristic Framework for Adaptive Poker AI
- Title(参考訳): Playing the Player: アダプティブポーカーAIのためのヒューリスティックフレームワーク
- Authors: Andrew Paterson, Carl Sanders,
- Abstract要約: この論文では、反対の哲学に基づいて構築されたAIであるPatrickを紹介します。
パトリックの建築は、人間の敵の欠陥、心理的、そしてしばしば不合理な性質を理解し、攻撃する目的で作られたエンジンである。
本報告では,64,267ハンドの試行において,その設計の詳細な解析,新しい予測アンコール学習法,その収益性などを通じて,解決された神話が,現実の,はるかに興味深い課題から逸脱していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For years, the discourse around poker AI has been dominated by the concept of solvers and the pursuit of unexploitable, machine-perfect play. This paper challenges that orthodoxy. It presents Patrick, an AI built on the contrary philosophy: that the path to victory lies not in being unexploitable, but in being maximally exploitative. Patrick's architecture is a purpose-built engine for understanding and attacking the flawed, psychological, and often irrational nature of human opponents. Through detailed analysis of its design, its novel prediction-anchored learning method, and its profitable performance in a 64,267-hand trial, this paper makes the case that the solved myth is a distraction from the real, far more interesting challenge: creating AI that can master the art of human imperfection.
- Abstract(参考訳): 長年にわたり、ポーカーAIに関する議論は、解決者の概念と、説明不能でマシン・パーフェクトな遊びの追求によって支配されてきた。
本稿ではその正統性に挑戦する。
それは反対の哲学に基づいて構築されたAIであるパトリック(Patrick)を提示する:勝利への道は、説明不能であるだけでなく、最大限に搾取的であることにある。
パトリックの建築は、人間の敵の欠陥、心理的、そしてしばしば不合理な性質を理解し、攻撃する目的で作られたエンジンである。
そこで本研究では,64,267ハンドの試行において,その設計の詳細な分析,新しい予測アンコール学習法,そしてその利益を生かしたパフォーマンスを通じて,解決された神話が,人間の不完全な芸術を習得できるAIを作成するという,現実的ではるかに興味深い課題からの逸脱であることを示す。
関連論文リスト
- People use fast, flat goal-directed simulation to reason about novel problems [68.55490343866545]
私たちは、人々が初めてゲームをする方法に体系的かつ適応的に合理的であることを示します。
直感型ゲーマー」と呼ばれる計算認知モデルを用いて,これらの能力を説明する。
私たちの研究は、人々が新しい問題に遭遇するとき、どのように素早く評価し、行動し、提案するかに関する新しい洞察を提供する。
論文 参考訳(メタデータ) (2025-10-13T15:12:08Z) - MAD Chairs: A new tool to evaluate AI [0.0]
本稿では,AIを評価する新しい手法を提案する。
チェスにおけるマシンのパフォーマンスを評価できる限り、このアプローチでは「MADチェア」と呼ばれるゲームでマシンのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2025-03-26T20:58:22Z) - The AI Alignment Paradox [10.674155943520729]
AIモデルを私たちの価値観と整合させるほど、敵がモデルを誤アライズするのが容易になるかもしれません。
AIの現実世界への影響が増大しているため、研究者の広いコミュニティがAIアライメントパラドックスを認識していることが不可欠である。
論文 参考訳(メタデータ) (2024-05-31T14:06:24Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - DecisionHoldem: Safe Depth-Limited Solving With Diverse Opponents for Imperfect-Information Games [31.26667266662521]
DecisionHoldemは、ディープ・リミテッド・サブゲームによる安全な解法を備えた、ヘッドアップ・ノー・リミット・テキサスホールディングスのためのハイレベルAIだ。
我々は,不完全な情報ゲームにおけるAI開発を促進するために,DecisionHoldemのソースコードとツールをリリースする。
論文 参考訳(メタデータ) (2022-01-27T15:35:49Z) - AI in Games: Techniques, Challenges and Opportunities [40.86375378643978]
Libratus、OpenAI Five、AlphaStarといった様々なゲームAIシステムが開発され、プロの人間プレイヤーに勝っている。
本稿では,最近成功したゲームAI,ボードゲームAI,カードゲームAI,ファーストパーソンシューティングゲームAI,リアルタイム戦略ゲームAIについて調査する。
論文 参考訳(メタデータ) (2021-11-15T09:35:53Z) - A User-Centred Framework for Explainable Artificial Intelligence in
Human-Robot Interaction [70.11080854486953]
本稿では,XAIのソーシャル・インタラクティブな側面に着目したユーザ中心型フレームワークを提案する。
このフレームワークは、エキスパートでないユーザのために考えられた対話型XAIソリューションのための構造を提供することを目的としている。
論文 参考訳(メタデータ) (2021-09-27T09:56:23Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。