論文の概要: A Limited-Capacity Minimax Theorem for Non-Convex Games or: How I
Learned to Stop Worrying about Mixed-Nash and Love Neural Nets
- arxiv url: http://arxiv.org/abs/2002.05820v3
- Date: Mon, 15 Mar 2021 21:37:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 04:21:45.004282
- Title: A Limited-Capacity Minimax Theorem for Non-Convex Games or: How I
Learned to Stop Worrying about Mixed-Nash and Love Neural Nets
- Title(参考訳): 非凸ゲームのための限定容量ミニマックス定理、または:混合ナッシュと愛のニューラルネットの心配をやめる方法
- Authors: Gauthier Gidel, David Balduzzi, Wojciech Marian Czarnecki, Marta
Garnelo and Yoram Bachrach
- Abstract要約: 多目的最適化の特殊な例であるAdrial Trainingは、ますます普及している機械学習技術である。
GANベースの生成再生技術は、Goのようなポーカーゲームに応用されている。
- 参考スコア(独自算出の注目度): 29.606063890097275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adversarial training, a special case of multi-objective optimization, is an
increasingly prevalent machine learning technique: some of its most notable
applications include GAN-based generative modeling and self-play techniques in
reinforcement learning which have been applied to complex games such as Go or
Poker. In practice, a \emph{single} pair of networks is typically trained in
order to find an approximate equilibrium of a highly nonconcave-nonconvex
adversarial problem. However, while a classic result in game theory states such
an equilibrium exists in concave-convex games, there is no analogous guarantee
if the payoff is nonconcave-nonconvex. Our main contribution is to provide an
approximate minimax theorem for a large class of games where the players pick
neural networks including WGAN, StarCraft II, and Blotto Game. Our findings
rely on the fact that despite being nonconcave-nonconvex with respect to the
neural networks parameters, these games are concave-convex with respect to the
actual models (e.g., functions or distributions) represented by these neural
networks.
- Abstract(参考訳): GANベースの生成モデリングや、GoやPokerといった複雑なゲームに応用された強化学習における自己再生技術など、最も注目すべき応用は、多目的最適化の特殊なケースである。
実際、emph{single} 対のネットワークは通常、非凸非凸対問題の近似平衡を求めるために訓練される。
しかし、ゲーム理論の古典的な結果では、そのような平衡は凸ゲームに存在するが、ペイオフが非凸ゲームである場合の類似の保証はない。
我々の主な貢献は、プレイヤーがwgan、starcraft ii、blotto gameなどのニューラルネットワークを選択する大規模なゲームに対する近似的ミニマックス定理を提供することです。
ニューラルネットワークパラメータに関して非凹凸であるにもかかわらず、これらのゲームは実際のモデル(例えば、関数や分布)に関して凹凸であるという事実に依存している。
関連論文リスト
- Mastering NIM and Impartial Games with Weak Neural Networks: An AlphaZero-inspired Multi-Frame Approach [0.0]
本稿では,Bei Zhou氏の研究成果を検証し,解説する理論的枠組みを提供する。
我々は,AlphaZeroスタイルの強化学習アルゴリズムが,NIMにおける最適プレイの学習に苦慮していることを示す。
論文 参考訳(メタデータ) (2024-11-10T09:34:26Z) - Game Theory Meets Statistical Mechanics in Deep Learning Design [0.06990493129893112]
本稿では,ゲーム理論の原理と統計力学の法則をシームレスに融合する新しいディープ表現を提案する。
単一の学習フレームワーク内で特徴抽出、次元縮小、パターン分類を行う。
論文 参考訳(メタデータ) (2024-10-16T06:02:18Z) - LinSATNet: The Positive Linear Satisfiability Neural Networks [116.65291739666303]
本稿では,ニューラルネットワークに人気の高い正の線形満足度を導入する方法について検討する。
本稿では,古典的なシンクホーンアルゴリズムを拡張し,複数の辺分布の集合を共同で符号化する,最初の微分可能満足層を提案する。
論文 参考訳(メタデータ) (2024-07-18T22:05:21Z) - On Tractable $Φ$-Equilibria in Non-Concave Games [53.212133025684224]
非凹面ゲームはゲーム理論と最適化に重大な課題をもたらす。
Phi$が有限であるとき、対応する$Phi$-equilibriaに収束する効率的な非結合学習アルゴリズムが存在することを示す。
また,オンライングラディエントDescentは,非自明な状況下で効率よく$Phi$-equilibriaを近似できることを示した。
論文 参考訳(メタデータ) (2024-03-13T01:51:30Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。
ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文 参考訳(メタデータ) (2022-08-22T08:31:46Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Solving Min-Max Optimization with Hidden Structure via Gradient Descent
Ascent [40.99558326586079]
非コンケーブゼロサムゲームクラスは、ゼロサムゲームを隠す機能を持つ。
我々は「隠れた」凸凹ゲームのフォン・ノイマン平衡への収束を証明する。
我々の保証は非ローカルであり、これは我々が知る限り、非コンケーブゲームにおける第一種の結果である。
論文 参考訳(メタデータ) (2021-01-13T18:13:49Z) - Provably Training Neural Network Classifiers under Fairness Constraints [70.64045590577318]
過パラメータのニューラルネットワークが制約を満たしていることを示す。
公平なニューラルネットワーク分類器を構築する上で重要な要素は、ニューラルネットワークの非応答解析を確立することである。
論文 参考訳(メタデータ) (2020-12-30T18:46:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。