論文の概要: Three-Player Game Training Dynamics
- arxiv url: http://arxiv.org/abs/2208.06531v1
- Date: Fri, 12 Aug 2022 23:57:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-16 14:50:13.839998
- Title: Three-Player Game Training Dynamics
- Title(参考訳): 3人プレイのゲームトレーニングダイナミクス
- Authors: Kenneth Christofferson and Fernando J. Yanez
- Abstract要約: 単純化されたバイリニアスムースゲームの拡張版を用いて,3人プレイヤゲームトレーニングのダイナミクスを探索する。
ほとんどの場合、三線型ゲームはナッシュ均衡に収束しない。
更新と同時更新の交互化に加えて,新たな更新順序--maximizer-first-を探索する。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work explores three-player game training dynamics, under what conditions
three-player games converge and the equilibria the converge on. In contrast to
prior work, we examine a three-player game architecture in which all players
explicitly interact with each other. Prior work analyzes games in which two of
three agents interact with only one other player, constituting dual two-player
games. We explore three-player game training dynamics using an extended version
of a simplified bilinear smooth game, called a simplified trilinear smooth
game. We find that trilinear games do not converge on the Nash equilibrium in
most cases, rather converging on a fixed point which is optimal for two
players, but not for the third. Further, we explore how the order of the
updates influences convergence. In addition to alternating and simultaneous
updates, we explore a new update order--maximizer-first--which is only possible
in a three-player game. We find that three-player games can converge on a Nash
equilibrium using maximizer-first updates. Finally, we experiment with
differing momentum values for each player in a trilinear smooth game under all
three update orders and show that maximizer-first updates achieve more optimal
results in a larger set of player-specific momentum value triads than other
update orders.
- Abstract(参考訳): 本研究は,3プレイヤーゲームが収束し,均衡が収束する条件下での3プレイヤーゲームトレーニングダイナミクスを探求する。
従来の作業とは対照的に,すべてのプレイヤーが明示的に相互作用する3人プレイヤゲームアーキテクチャを検討する。
先行作業は、3人のエージェントのうち2人が他の1人のプレイヤーとやり取りするゲームを分析し、二重の2人のプレイヤーゲームを構成する。
単純化された双線形スムースゲームの拡張版であるトリリニアスムースゲームを用いて,3人のプレイヤゲームトレーニングダイナミクスを探索する。
我々は、ほとんどの場合、トリ線型ゲームはナッシュ均衡に収束せず、むしろ2人のプレイヤーに最適だが3人目のプレイヤーには最適である固定点に収束する。
さらに,更新順序が収束に与える影響についても検討する。
交互更新と同時更新に加えて、3人プレイのゲームでのみ可能となる、新しい更新順序-最大化-ファースト-について検討する。
3人プレイヤゲームは最大値更新を用いてナッシュ平衡に収束する。
最後に, 3つの更新順序すべての下で, トリリニアスムーズゲームにおける各プレイヤーの運動量値の相違を実験し, 最大値更新が他の更新順序よりも大きなプレイヤー固有運動量値トライアドのセットでより最適な結果が得られることを示す。
関連論文リスト
- Leading the Pack: N-player Opponent Shaping [52.682734939786464]
我々は、複数のコプレーヤと複数のシェーピングエージェントを含む環境に、対向型シェーピング(OS)メソッドを拡張します。
多数のコプレーヤでプレイすると,OSメソッドの相対的な性能が低下し,OSメソッドが動作しない可能性が示唆された。
論文 参考訳(メタデータ) (2023-12-19T20:01:42Z) - On the Convergence of No-Regret Learning Dynamics in Time-Varying Games [89.96815099996132]
時間変化ゲームにおける楽観的勾配降下(OGD)の収束を特徴付ける。
我々のフレームワークは、ゼロサムゲームにおけるOGDの平衡ギャップに対して鋭い収束境界をもたらす。
また,静的ゲームにおける動的後悔の保証に関する新たな洞察も提供する。
論文 参考訳(メタデータ) (2023-01-26T17:25:45Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Evolutionary Game-Theoretical Analysis for General Multiplayer
Asymmetric Games [22.753799819424785]
不正確さなしに、ペイオフテーブルと動的分析のギャップを埋める。
いくつかの古典ゲームにおいて,本手法を最先端のゲームと比較する。
論文 参考訳(メタデータ) (2022-06-22T14:06:23Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Computing Nash Equilibria in Multiplayer DAG-Structured Stochastic Games
with Persistent Imperfect Information [1.7132914341329848]
永続的不完全情報を持つマルチプレイヤー汎用ゲームにおいて,ナッシュ均衡を近似するアルゴリズムを提案する。
新たな手法を用いることで,本ゲームにおけるナッシュ均衡を近似した戦略をアルゴリズムで計算できることが証明できる。
論文 参考訳(メタデータ) (2020-10-26T19:27:26Z) - Exponential Convergence of Gradient Methods in Concave Network Zero-sum
Games [6.129776019898013]
コンケーブネットワークゼロサムゲーム(NZSG)におけるナッシュ平衡の計算について検討する。
この一般化において,凸凹型2プレーヤゼロサムゲームの様々なゲーム理論的性質が保存されていることを示す。
論文 参考訳(メタデータ) (2020-07-10T16:56:56Z) - Chaos, Extremism and Optimism: Volume Analysis of Learning in Games [55.24050445142637]
本稿では,ゼロサムにおける乗算重み更新 (MWU) と最適乗算重み更新 (OMWU) のボリューム解析と協調ゲームについて述べる。
我々は、OMWUが、その既知の収束挙動の代替的な理解を提供するために、ボリュームを契約していることを示します。
我々はまた、コーディネートゲームを調べる際に役割が逆になるという意味で、自由ランチ型の定理も証明する: OMWU は指数関数的に高速に体積を拡大するが、MWU は契約する。
論文 参考訳(メタデータ) (2020-05-28T13:47:09Z) - From Poincar\'e Recurrence to Convergence in Imperfect Information
Games: Finding Equilibrium via Regularization [49.368421783733815]
モノトーンゲームにおいて,報酬の適応が強い収束保証を与えることを示す。
また、この報酬適応手法を用いて、Nash平衡に正確に収束するアルゴリズムを構築する方法を示す。
論文 参考訳(メタデータ) (2020-02-19T21:36:58Z) - Empirical Analysis of Fictitious Play for Nash Equilibrium Computation in Multiplayer Games [0.4895118383237099]
架空のプレイは、2つのプレイヤーゼロサムゲームのような特定のゲームクラスにおいてナッシュ均衡に収束することが保証される。
実のところ、架空の遊びは、様々なゲームクラスやサイズに対するナッシュ均衡近似の改善につながることを示す。
論文 参考訳(メタデータ) (2020-01-30T03:47:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。