論文の概要: Ordinal Potential-based Player Rating
- arxiv url: http://arxiv.org/abs/2306.05366v1
- Date: Thu, 8 Jun 2023 17:08:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 13:17:58.500062
- Title: Ordinal Potential-based Player Rating
- Title(参考訳): 正規電位に基づくプレイヤーレーティング
- Authors: Nelson Vadori and Rahul Savani
- Abstract要約: エロ評価は、正しい空間で計算されたとき、実際に推移性を保つことを示す。
我々は、加法的に分離可能なポテンシャル関数を持つ順序ポテンシャルゲームの弱い変種として、推移ゲームの特徴を与える。
- 参考スコア(独自算出の注目度): 4.264192013842096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A two-player symmetric zero-sum game is transitive if for any pure strategies
$x$, $y$, $z$, if $x$ is better than $y$, and $y$ is better than $z$, then $x$
is better than $z$. It was recently observed that the Elo rating fails at
preserving transitive relations among strategies and therefore cannot correctly
extract the transitive component of a game. Our first contribution is to show
that the Elo rating actually does preserve transitivity when computed in the
right space. Precisely, using a suitable invertible mapping $\varphi$, we first
apply $\varphi$ to the game, then compute Elo ratings, then go back to the
original space by applying $\varphi^{-1}$. We provide a characterization of
transitive games as a weak variant of ordinal potential games with additively
separable potential functions. Leveraging this insight, we introduce the
concept of transitivity order, the minimum number of invertible mappings
required to transform the payoff of a transitive game into (differences of) its
potential function. The transitivity order is a tool to classify transitive
games, with Elo games being an example of transitive games of order one. Most
real-world games have both transitive and non-transitive (cyclic) components,
and we use our analysis of transitivity to extract the transitive (potential)
component of an arbitrary game. We link transitivity to the known concept of
sign-rank: transitive games have sign-rank two; arbitrary games may have higher
sign-rank. Using a neural network-based architecture, we learn a decomposition
of an arbitrary game into transitive and cyclic components that prioritises
capturing the sign pattern of the game. In particular, a transitive game always
has just one component in its decomposition, the potential component. We
provide a comprehensive evaluation of our methodology using both toy examples
and empirical data from real-world games.
- Abstract(参考訳): 2人のプレイヤーが対称なゼロサムゲームが推移的である場合、純粋な戦略である$x$、$y$、$z$、$x$が$y$より良い場合、$y$は$z$よりも良い場合、$x$は$z$よりよい。
近年,戦略間の推移的関係を維持できないため,ゲームの推移的要素を正しく抽出できないことが明らかとなった。
私たちの最初の貢献は、正しい空間で計算されたとき、エロ評価が実際に遷移性を保存することを示すことです。
正確には、適切な可逆写像$\varphi$を用いて、まずゲームに$\varphi$を適用し、次にelo ratingsを計算し、$\varphi^{-1}$を適用して元の空間に戻る。
我々は、加法的に分離可能なポテンシャル関数を持つ順序ポテンシャルゲームの弱い変種として推移ゲームの特徴を与える。
この知見を応用して、推移性次数の概念を導入し、推移ゲームのペイオフをポテンシャル関数に変換するのに必要な可逆写像の最小個を導入する。
推移性順序は推移ゲームを分類するためのツールであり、エロゲームは順序1の推移ゲームの一例である。
ほとんどの実世界のゲームは推移的成分と非推移的成分の両方を持ち、遷移性の分析を用いて任意のゲームの推移的成分を抽出する。
推移性は記号ランクの概念と結びついている: 推移性ゲームは符号ランク2を持ち、任意のゲームはより高い符号ランクを持つ。
ニューラルネットワークをベースとしたアーキテクチャを用いて,任意のゲームから過渡的かつ循環的なコンポーネントへの分解を学習し,ゲームのサインパターンを優先する。
特に、推移ゲームは、その分解において、ポテンシャル成分である1つの成分しか持たない。
実世界のゲームからの経験的データと玩具の例を用いて,我々の方法論を総合的に評価する。
関連論文リスト
- Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文 参考訳(メタデータ) (2024-02-14T02:17:37Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Game Theoretic Rating in N-player general-sum games with Equilibria [26.166859475522106]
そこで我々は,N-playerに適した新しいアルゴリズムを提案する。
これにより、平衡のような確立された解の概念を利用でき、複雑な戦略的相互作用を持つゲームにおける戦略を効率的に評価することができる。
論文 参考訳(メタデータ) (2022-10-05T12:33:03Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Understanding Game-Playing Agents with Natural Language Annotations [34.66200889614538]
本稿では,Goの10万個の人手による注釈付きゲームを含む新しいデータセットを提案する。
モデル解釈可能性のためのツールとして、これらの自然言語アノテーションをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2022-04-15T16:11:08Z) - Modelling Adversarial Noise for Adversarial Defense [96.56200586800219]
敵の防御は、通常、敵の音を除去したり、敵の頑強な目標モデルを訓練するために、敵の例を活用することに焦点を当てる。
逆データと自然データの関係は、逆データからクリーンデータを推測し、最終的な正しい予測を得るのに役立ちます。
本研究では, ラベル空間の遷移関係を学習するために, 逆方向の雑音をモデル化し, 逆方向の精度を向上させることを目的とした。
論文 参考訳(メタデータ) (2021-09-21T01:13:26Z) - An Empirical Study on the Generalization Power of Neural Representations
Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。
提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文 参考訳(メタデータ) (2021-01-31T10:30:48Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。