論文の概要: Quantifying Skill and Chance: A Unified Framework for the Geometry of Games
- arxiv url: http://arxiv.org/abs/2511.11611v1
- Date: Mon, 03 Nov 2025 17:05:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-23 18:31:12.294357
- Title: Quantifying Skill and Chance: A Unified Framework for the Geometry of Games
- Title(参考訳): スキルとチャンスの定量化:ゲーム幾何学のための統一フレームワーク
- Authors: David H. Silver,
- Abstract要約: 決定木を相補的な制御源としてモデル化することで,ゲームにおけるスキルとチャンスを分離する定量的枠組みを導入する。
我々は,ゲームの結果をスキルレバレッジKに分解し,Lを活用することにより,[-1, 1]のスキルラック指数S(G)を定義する。
これを30ゲームに適用すると、バックギャモン(S = 0, Sigma = 1.20)のような混合ドメインから純粋なスキル(チェス、S = +1, Sigma = 0)までの連続体(coin toss, S = -1)が明らかになる。
- 参考スコア(独自算出の注目度): 0.09229852843814058
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce a quantitative framework for separating skill and chance in games by modeling them as complementary sources of control over stochastic decision trees. We define the Skill-Luck Index S(G) in [-1, 1] by decomposing game outcomes into skill leverage K and luck leverage L. Applying this to 30 games reveals a continuum from pure chance (coin toss, S = -1) through mixed domains such as backgammon (S = 0, Sigma = 1.20) to pure skill (chess, S = +1, Sigma = 0). Poker exhibits moderate skill dominance (S = 0.33) with K = 0.40 +/- 0.03 and Sigma = 0.80. We further introduce volatility Sigma to quantify outcome uncertainty over successive turns. The framework extends to general stochastic decision systems, enabling principled comparisons of player influence, game balance, and predictive stability, with applications to game design, AI evaluation, and risk assessment.
- Abstract(参考訳): 確率的決定木に対する相補的な制御源としてモデル化することで,ゲームにおけるスキルとチャンスを分離するための定量的枠組みを導入する。
これを30ゲームに適用すると、バックガンモン(S = 0, Sigma = 1.20)のような混合ドメインから純粋なスキル(チェス、S = +1, Sigma = 0)への連続体が現れる。
ポーカーは、K = 0.40 +/- 0.03、Sigma = 0.80で適度なスキル優位(S = 0.33)を示す。
さらにボラティリティ・シグマを導入し、連続するターンにおける結果の不確実性を定量化する。
このフレームワークは一般的な確率的決定システムにまで拡張され、プレイヤーの影響、ゲームバランス、予測安定性の原則的な比較を可能にし、ゲームデザイン、AI評価、リスクアセスメントに応用できる。
関連論文リスト
- Do LLMs Know When to Flip a Coin? Strategic Randomization through Reasoning and Experience [1.7223564681760168]
戦略的ランダム化はゲーム理論の鍵となる原理であるが、大きな言語モデル(LLM)では未探索のままである。
我々は,天地競馬に触発された新たなゼロサムゲームを提案し,ナッシュ均衡は最大エントロピー戦略に対応する。
より弱いモデルはプロンプトによらず決定論的であることを示し、強いモデルは明示的なヒントの下でランダム化を増大させることを示した。
論文 参考訳(メタデータ) (2025-06-21T05:26:33Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Scalable and Independent Learning of Nash Equilibrium Policies in
$n$-Player Stochastic Games with Unknown Independent Chains [1.0878040851638]
独立な連鎖と未知の遷移行列を持つゲームについて研究する。
このクラスのゲームでは、プレイヤーは他のプレイヤーの状態や行動に依存しない内部マルコフ連鎖を制御する。
我々は、$epsilon$-NEポリシーを学ぶために、完全に分散化されたミラー降下アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-04T03:04:09Z) - Payoff-based learning with matrix multiplicative weights in quantum
games [35.111876815522116]
量子ゲーム(および半定値ゲーム)における学習の問題を、スカラーでペイオフに基づくフィードバックを用いて研究する。
本稿では,情報フレームワークに合わせた最小情報行列乗法(3MW)を提案する。
決定論的ペイオフフィードバックを持つ3MW法は,量子ミニマックスゲームにおけるバニラ,フル情報MMWアルゴリズムの収束率を保っていることを示す。
論文 参考訳(メタデータ) (2023-11-04T14:56:17Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - A Unified Approach to Reinforcement Learning, Quantal Response
Equilibria, and Two-Player Zero-Sum Games [104.3339905200105]
この研究は、ミラー降下と非ユークリッド近位勾配アルゴリズムにインスパイアされた、磁気ミラー降下と呼ばれるアルゴリズムを研究する。
我々の貢献は、2人のプレイヤーゼロサムゲームにおける平衡解法および強化学習へのアプローチとしての磁気ミラー降下の利点を実証することである。
論文 参考訳(メタデータ) (2022-06-12T19:49:14Z) - Estimation of Skill Distributions [39.29885444997579]
トーナメントにおけるペアゲームの観察から,エージェント集団のスキル分布を学習する問題について検討する。
ほぼ最適の最小値平均二乗誤差スケーリングでスキル密度を学習する,単純かつトラクタブルなアルゴリズムを提案する。
我が国の結果は、2008年の大恐慌以前の低品質ファンドの多さと、金融危機後のより熟練した資金による業界支配に光を当てた。
論文 参考訳(メタデータ) (2020-06-15T07:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。