論文の概要: Learn to Predict Equilibria via Fixed Point Networks
- arxiv url: http://arxiv.org/abs/2106.00906v1
- Date: Wed, 2 Jun 2021 02:55:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 07:58:40.223236
- Title: Learn to Predict Equilibria via Fixed Point Networks
- Title(参考訳): 固定点ネットワークによる平衡予測を学ぶ
- Authors: Howard Heaton, Daniel McKenzie, Qiuwei Li, Samy Wu Fung, Stanley
Osher, Wotao Yin
- Abstract要約: この研究は、暗黙の深度ニューラルネットワークのクラスであるNash Fixed Point Networks (N-FPNs)を導入し、コンテキストゲームのNash平衡を出力する。
本稿では,N-FPNのエンドツーエンドトレーニング方式を提案する。
- 参考スコア(独自算出の注目度): 21.00060644438722
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Systems of interacting agents can often be modeled as contextual games, where
the context encodes additional information, beyond the control of any agent
(e.g. weather for traffic and fiscal policy for market economies). In such
systems, the most likely outcome is given by a Nash equilibrium. In many
practical settings, only game equilibria are observed, while the optimal
parameters for a game model are unknown. This work introduces Nash Fixed Point
Networks (N-FPNs), a class of implicit-depth neural networks that output Nash
equilibria of contextual games. The N-FPN architecture fuses data-driven
modeling with provided constraints. Given equilibrium observations of a
contextual game, N-FPN parameters are learnt to predict equilibria outcomes
given only the context. We present an end-to-end training scheme for N-FPNs
that is simple and memory efficient to implement with existing
autodifferentiation tools. N-FPNs also exploit a novel constraint decoupling
scheme to avoid costly projections. Provided numerical examples show the
efficacy of N-FPNs on atomic and non-atomic games (e.g. traffic routing).
- Abstract(参考訳): 対話エージェントのシステムはコンテキストゲームとしてモデル化され、コンテキストは任意のエージェント(例えば)の制御を超えて追加情報を符号化する。
交通の天気と市場経済の財政政策)
そのようなシステムでは、最も可能性の高い結果はナッシュ平衡によって与えられる。
多くの実践的な設定では、ゲーム平衡のみが観察され、ゲームモデルの最適パラメータが不明である。
この研究は、暗黙の深度ニューラルネットワークのクラスであるNash Fixed Point Networks (N-FPNs)を導入し、コンテキストゲームのNash平衡を出力する。
N-FPNアーキテクチャはデータ駆動モデリングを制約付きで融合させる。
文脈ゲームにおける平衡観測から、N-FPNパラメータは、文脈のみに与えられる平衡結果を予測するために学習される。
本稿では,N-FPNのエンドツーエンドトレーニング方式を提案する。
N-FPNはまた、コストのかかる投影を避けるために、新しい制約デカップリングスキームを利用する。
与えられた数値的な例は、原子ゲームや非原子ゲーム(例えば、N-FPN)に対する効果を示している。
交通経路)。
関連論文リスト
- On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非凹面ゲームはゲーム理論と最適化に重大な課題をもたらす。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
また,オンライングラディエントDescentは,非自明な状況下で効率よく$Phi$-equilibriaを近似できることを示した。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Multi-Sender Persuasion: A Computational Perspective [41.88812114165843]
マルチベンダーの説得問題を考察する。
計算経済学、マルチエージェント学習、機械学習で広く使われている。
我々は,このゲームの非線形かつ不連続なユーティリティを近似するために,新しい微分可能なニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2024-02-07T15:50:20Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - Scaling Laws Beyond Backpropagation [64.0476282000118]
因果デコーダのみの変換器を効率的に訓練するための直接フィードバックアライメントの有効性について検討した。
DFAはバックプロパゲーションよりも効率的なスケーリングを提供していないことが分かりました。
論文 参考訳(メタデータ) (2022-10-26T10:09:14Z) - Turbocharging Solution Concepts: Solving NEs, CEs and CCEs with Neural
Equilibrium Solvers [22.85979978964773]
Nash Equilibria、Correlated Equilibria、Coarse Correlated Equilibriaといったソリューション概念は多くのマルチエージェント機械学習アルゴリズムに有用なコンポーネントである。
本稿では, ニューラルネットワークアーキテクチャを応用して, 固定形状, 購入速度, 決定性のすべてのゲームの空間を大まかに解決するニューラル平衡解法を提案する。
論文 参考訳(メタデータ) (2022-10-17T17:00:31Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - ESCHER: Eschewing Importance Sampling in Games by Computing a History
Value Function to Estimate Regret [97.73233271730616]
超大型ゲームにおけるナッシュ均衡の近似手法 : ニューラルネットワークを用いて近似最適ポリシー(戦略)を学習する
DREAMは,モンテカルロCFR(MCCFR)から受け継がれた重要なサンプリング項により,極めて高いばらつきを有すると推定された後悔のターゲット上で,ニューラルネットワークを訓練する。
ESCHERの深層学習バージョンは、DREAMとニューラル・フィクション・セルフプレイ(NFSP)の先行状態よりも優れており、ゲームサイズが大きくなるにつれて、その違いは劇的になる。
論文 参考訳(メタデータ) (2022-06-08T18:43:45Z) - On the Convergence of Fictitious Play: A Decomposition Approach [17.607284715519587]
我々は、FP(Fictitious Play)の収束結果を、そのようなゲームとそれ以上の組み合わせに拡張する。
我々は,この2種類のゲームが相互に移動可能であるという意味で,協調と競争を統一する線形関係を構築している。
我々は、FPの非収束例であるShapleyゲームを分析し、FPが収束するのに十分な条件を開発する。
論文 参考訳(メタデータ) (2022-05-03T13:04:09Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Model-Free Online Learning in Unknown Sequential Decision Making
Problems and Games [114.90723492840499]
大規模な2人プレイのゼロサム情報ゲームでは、反事実後悔最小化(cfr)の現代的な拡張がnash均衡を計算するための実用的な技術である。
私たちは、戦略空間がエージェントに知られていないオンライン学習設定を形式化します。
エージェントが逆の環境に直面しても、その設定に高い確率で$O(T3/4)$後悔を達成する効率的なアルゴリズムを提供します。
論文 参考訳(メタデータ) (2021-03-08T04:03:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。