論文の概要: Real World Games Look Like Spinning Tops
- arxiv url: http://arxiv.org/abs/2004.09468v2
- Date: Wed, 17 Jun 2020 15:41:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 17:53:33.622292
- Title: Real World Games Look Like Spinning Tops
- Title(参考訳): 現実世界のゲームは回転するトップスに見える
- Authors: Wojciech Marian Czarnecki, Gauthier Gidel, Brendan Tracey, Karl Tuyls,
Shayegan Omidshafiei, David Balduzzi, Max Jaderberg
- Abstract要約: 本稿では,実世界のゲーム(例えば,Tic-Tac-Toe,Go,StarCraft II)の幾何学的性質について検討する。
それらの幾何学構造は回転するトップに似ていると仮定する。
我々は、この幾何学が現実世界のゲームに広く存在することを証明し、その時間的性質を明らかにする。
エージェントの訓練に戦略の人口がなぜ必要か,ゲームの構造にどの程度の人口が関係しているかを明らかにする。
- 参考スコア(独自算出の注目度): 27.182163984605193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the geometrical properties of real world games (e.g.
Tic-Tac-Toe, Go, StarCraft II). We hypothesise that their geometrical structure
resemble a spinning top, with the upright axis representing transitive
strength, and the radial axis, which corresponds to the number of cycles that
exist at a particular transitive strength, representing the non-transitive
dimension. We prove the existence of this geometry for a wide class of real
world games, exposing their temporal nature. Additionally, we show that this
unique structure also has consequences for learning - it clarifies why
populations of strategies are necessary for training of agents, and how
population size relates to the structure of the game. Finally, we empirically
validate these claims by using a selection of nine real world two-player
zero-sum symmetric games, showing 1) the spinning top structure is revealed and
can be easily re-constructed by using a new method of Nash clustering to
measure the interaction between transitive and cyclical strategy behaviour, and
2) the effect that population size has on the convergence in these games.
- Abstract(参考訳): 本稿では実世界のゲーム(tic-tac-toe, go, starcraft ii)の幾何学的性質について考察する。
我々は、それらの幾何学的構造がスピントップに似ており、直立軸は推移強度を表し、半径軸は特定の推移強度に存在する周期の数に対応し、非推移次元を表すと仮定する。
我々は、この幾何学が現実世界のゲームに広く存在することを証明し、その時間的性質を明らかにする。
さらに,この一意的な構造は学習にも影響を与えることを示し,エージェントの訓練に戦略の集団が必要な理由と,その集団の大きさがゲームの構造にどのように関係しているかを明らかにする。
最後に,9つの実世界2プレイヤーゼロサム対称ゲームの選択を用いて,これらの主張を実証的に検証した。
1) 回転トップ構造が明らかになり, 新手法のナッシュクラスタリングにより, 過渡的および循環的戦略行動の相互作用を計測し, 容易に再構築できる。
2) このゲームにおける集団の大きさが収束に与える影響
関連論文リスト
- Representation Learning of Geometric Trees [9.280083998326285]
幾何学木に適した表現学習フレームワークを提案する。
最初はユニークなメッセージパッシングニューラルネットワークを備えており、これは幾何的構造を復元可能であり、回転変換不変である。
提案手法の有効性を実世界の8つのデータセットで検証し,幾何学木を表現できることを実証した。
論文 参考訳(メタデータ) (2024-08-16T15:16:35Z) - Communication Complexity of Graph Isomorphism, Coloring, and Distance Games [0.0]
最適な条件下では,完全非署名戦略が通信複雑性を崩壊させることを示す。
意外なことに、非シグナリング戦略は、古典的および量子的戦略と比較して、新しいゲームにとってより微妙な区別を提供する。
論文 参考訳(メタデータ) (2024-06-04T10:53:16Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Ordinal Potential-based Player Rating [6.454304238638547]
適切な空間で計算した場合、エロ評価が推移性を保つことを示す。
我々は,ゲームのサインパターンを優先する新たなゲーム分解を導入する。
我々は,従来のサインランクの概念にアプローチをリンクし,実世界のゲームから,おもちゃの例と経験的データの両方を用いて方法論を評価した。
論文 参考訳(メタデータ) (2023-06-08T17:08:52Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - A Marriage between Adversarial Team Games and 2-player Games: Enabling
Abstractions, No-regret Learning, and Subgame Solving [31.29335755664997]
emphExのアンテ相関は、プレイヤーのチームがゼロサムゲームで別のチームと対決する、後続のチームゲームにおいて主流のアプローチになりつつある。
本研究は, 連勝チームゲームと2プレーヤゲームとのギャップを埋めることで, この弱点から回復できることを示す。
我々は,emphteam-public-informationと呼ばれる新しいゲーム表現を提案し,チーム全体で共通する情報のみを知り,各メンバーに可能なプライベートな状態に対するアクションを指示する単一コーディネータとして表現する。
論文 参考訳(メタデータ) (2022-06-18T10:02:08Z) - Neural Convolutional Surfaces [59.172308741945336]
この研究は、大域的、粗い構造から、微細で局所的で、おそらく繰り返される幾何学を歪める形状の表現に関係している。
このアプローチは, 最先端技術よりも優れたニューラル形状圧縮を実現するとともに, 形状詳細の操作と伝達を可能にする。
論文 参考訳(メタデータ) (2022-04-05T15:40:11Z) - Navigating the Landscape of Multiplayer Games [20.483315340460127]
大規模ゲームの応答グラフにネットワーク測度を適用することで,ゲームのランドスケープを創出できることを示す。
本研究は, 標準ゲームから複雑な経験ゲームまで, 訓練されたエージェント同士のパフォーマンスを計測する領域における知見について述べる。
論文 参考訳(メタデータ) (2020-05-04T16:58:17Z) - From Poincar\'e Recurrence to Convergence in Imperfect Information
Games: Finding Equilibrium via Regularization [49.368421783733815]
モノトーンゲームにおいて,報酬の適応が強い収束保証を与えることを示す。
また、この報酬適応手法を用いて、Nash平衡に正確に収束するアルゴリズムを構築する方法を示す。
論文 参考訳(メタデータ) (2020-02-19T21:36:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。