論文の概要: Are Equivariant Equilibrium Approximators Beneficial?
- arxiv url: http://arxiv.org/abs/2301.11481v2
- Date: Thu, 27 Apr 2023 12:54:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-28 21:44:18.916719
- Title: Are Equivariant Equilibrium Approximators Beneficial?
- Title(参考訳): 等変平衡近似器は有益か?
- Authors: Zhijian Duan, Yunxuan Ma, Xiaotie Deng
- Abstract要約: 等変平衡近似器の利点と限界を理論的に特徴づける。
この利点のために、一般的なものよりもより優れた一般化性を示し、ペイオフ分布が置換不変である場合により良い近似を達成できることを示す。
限界については、均衡選択と社会福祉の観点から、それらの欠点について論じる。
- 参考スコア(独自算出の注目度): 3.947165805405381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, remarkable progress has been made by approximating Nash equilibrium
(NE), correlated equilibrium (CE), and coarse correlated equilibrium (CCE)
through function approximation that trains a neural network to predict
equilibria from game representations. Furthermore, equivariant architectures
are widely adopted in designing such equilibrium approximators in normal-form
games. In this paper, we theoretically characterize benefits and limitations of
equivariant equilibrium approximators. For the benefits, we show that they
enjoy better generalizability than general ones and can achieve better
approximations when the payoff distribution is permutation-invariant. For the
limitations, we discuss their drawbacks in terms of equilibrium selection and
social welfare. Together, our results help to understand the role of
equivariance in equilibrium approximators.
- Abstract(参考訳): 近年,ニューラルネットワークを用いてゲーム表現から平衡を予測する関数近似を通じて,ナッシュ平衡(NE),相関平衡(CE),粗相関平衡(CCE)を近似することで,顕著な進展が見られた。
さらに、同変アーキテクチャは正規形式ゲームにおけるそのような平衡近似器の設計に広く採用されている。
本稿では,同変平衡近似器の利点と限界を理論的に特徴づける。
この利点のために、一般的なものよりもより優れた一般化性を示し、ペイオフ分布が置換不変である場合により良い近似を達成できることを示す。
限界については、均衡選択と社会福祉の観点からそれらの欠点について議論する。
この結果は平衡近似器における等分散の役割を理解するのに役立つ。
関連論文リスト
- Approximate Equivariance in Reinforcement Learning [35.04248486334824]
等変ニューラルネットワークは強化学習において大きな成功を収めている。
多くの問題において、近似対称性のみが存在しており、これは正確な対称性を不適切なものにしている。
我々は、強化学習におけるほぼ同変のアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-06T19:44:46Z) - Machine learning in and out of equilibrium [58.88325379746631]
我々の研究は、統計物理学から適応したフォッカー・プランク法を用いて、これらの平行線を探索する。
我々は特に、従来のSGDでは平衡が切れている長期的限界におけるシステムの定常状態に焦点を当てる。
本稿では,ミニバッチの置き換えを伴わない新しいランゲヴィンダイナミクス(SGLD)を提案する。
論文 参考訳(メタデータ) (2023-06-06T09:12:49Z) - Bayes correlated equilibria and no-regret dynamics [9.89901717499058]
本稿では,不完全情報を持つゲームの基本モデルであるベイズゲームに対する平衡概念について検討する。
我々は,各プレイヤーのプライベート情報を収集し,関連するレコメンデーションをプレイヤーに送信する仲介者によって実現可能なコミュニケーション均衡に焦点を当てる。
本稿では,非直交スワップ後悔を線形上界で最小化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T06:22:51Z) - Observable Perfect Equilibrium [0.4895118383237099]
我々は、可観測完全均衡(observable perfect equilibrium)と呼ばれる拡張形式のゲームに対して、新しい平衡改善の概念を定義する。
我々は、観測可能な完全平衡は常に存在することを保証している。
我々は、観測可能な完全均衡が、人工知能に関心を持つ多くの重要な不完全な情報ゲームをモデル化する上で有用な平衡改善概念になることを期待する。
論文 参考訳(メタデータ) (2022-10-29T06:07:29Z) - Global Convergence of Over-parameterized Deep Equilibrium Models [52.65330015267245]
ディープ均衡モデル(Deep equilibrium model, DEQ)は、入射を伴う無限深度重み付きモデルの平衡点を通して暗黙的に定義される。
無限の計算の代わりに、ルートフィンディングで直接平衡点を解き、暗黙の微分で勾配を計算する。
本稿では,無限深度重み付きモデルの非漸近解析における技術的困難を克服する新しい確率的枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-27T08:00:13Z) - Optimal Correlated Equilibria in General-Sum Extensive-Form Games: Fixed-Parameter Algorithms, Hardness, and Two-Sided Column-Generation [78.48747645545944]
ワイドフォームゲームにおいて,様々な種類の最適平衡を求める問題について検討する。
これら3つの概念のすべてに最適な平衡を計算するための新しいアルゴリズムを導入する。
論文 参考訳(メタデータ) (2022-03-14T15:21:18Z) - On the Nash equilibrium of moment-matching GANs for stationary Gaussian
processes [2.25477613430341]
我々は、一貫したナッシュ均衡の存在は、判別器ファミリーの選択に大きく依存していることを示す。
さらに、一貫した平衡に向けた勾配降下法における局所安定性と大域収束について検討する。
論文 参考訳(メタデータ) (2022-03-14T14:30:23Z) - Optimization Induced Equilibrium Networks [76.05825996887573]
暗黙の方程式によって定義されるディープニューラルネットワーク(DNN)のような暗黙の平衡モデルは最近ますます魅力的になりつつある。
我々は,パラメータが少ない場合でも,OptEqが従来の暗黙的モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-05-27T15:17:41Z) - Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。
本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文 参考訳(メタデータ) (2021-02-23T05:11:07Z) - Universal Quantum Fluctuation-Dissipation Relation for Systems Far From
Equilibrium [3.0965505512285967]
詳細平衡条件に反する量子マルコフ過程に対する一般非平衡ゆらぎ散逸定理(FDT)を提案する。
ゆらぎとは別に、緩和は量子カールフラックスによって支配される余分な相関を含む。
本研究の結果は, 摂動状態および近平衡状態におけるゆらぎ-散逸関係の範囲を超え, 優位性を有する。
論文 参考訳(メタデータ) (2021-01-28T06:12:08Z) - Polynomial-Time Computation of Optimal Correlated Equilibria in
Two-Player Extensive-Form Games with Public Chance Moves and Beyond [107.14897720357631]
本研究では,公的なチャンス移動を伴う2人プレイヤゲームにおいて,最適相関平衡が時間内に計算可能であることを示す。
この結果、10年以上にわたる広範な形式の相関を取り巻く最大の正の複雑性結果が得られた。
論文 参考訳(メタデータ) (2020-09-09T14:51:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。