Fugu-MT 論文翻訳(概要): No-Regret Learning of Nash Equilibrium for Black-Box Games via Gaussian Processes

論文の概要: No-Regret Learning of Nash Equilibrium for Black-Box Games via Gaussian Processes

arxiv url: http://arxiv.org/abs/2405.08318v2
Date: Thu, 14 Nov 2024 04:52:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:32.379786
Title: No-Regret Learning of Nash Equilibrium for Black-Box Games via Gaussian Processes
Title（参考訳）: ガウス過程によるブラックボックスゲームのためのナッシュ平衡の非線形学習
Authors: Minbiao Han, Fengxue Zhang, Yuxin Chen,
Abstract要約: 本稿では,ブラックボックスゲームにおける学習の課題について検討する。我々はガウス過程を利用してそのようなゲームの平衡を同定する非回帰学習アルゴリズムを提供する。
参考スコア（独自算出の注目度）: 11.846329468283583
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper investigates the challenge of learning in black-box games, where the underlying utility function is unknown to any of the agents. While there is an extensive body of literature on the theoretical analysis of algorithms for computing the Nash equilibrium with complete information about the game, studies on Nash equilibrium in black-box games are less common. In this paper, we focus on learning the Nash equilibrium when the only available information about an agent's payoff comes in the form of empirical queries. We provide a no-regret learning algorithm that utilizes Gaussian processes to identify the equilibrium in such games. Our approach not only ensures a theoretical convergence rate but also demonstrates effectiveness across a variety collection of games through experimental validation.
Abstract（参考訳）: 本稿では,ブラックボックスゲームにおける学習の課題について検討する。ゲームについての完全な情報とともにナッシュ均衡を計算するアルゴリズムの理論解析に関する広範な文献があるが、ブラックボックスゲームにおけるナッシュ均衡の研究は一般的ではない。本稿では,エージェントの支払情報だけが経験的クエリの形で得られる場合,ナッシュ均衡の学習に焦点をあてる。我々はガウス過程を利用してそのようなゲームの平衡を同定する非回帰学習アルゴリズムを提供する。提案手法は, 理論収束率を保証するだけでなく, 実験的な検証を通じて, 様々なゲーム群に対して有効性を示す。

関連論文リスト

Last-Iterate Convergence of No-Regret Learning for Equilibria in Bargaining Games [0.0]
正規化リーダをフォローするアルゴリズムは,様々なゲームにおいて最後にナッシュ平衡に収束することを示す。この研究は、単純な学習アルゴリズムを用いて、複雑な経済行動がもたらす影響を実証する。
論文参考訳（メタデータ） (2025-07-03T20:12:59Z)
Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文参考訳（メタデータ） (2024-01-10T12:56:24Z)
A survey on algorithms for Nash equilibria in finite normal-form games [15.76104985336285]
ナッシュ均衡はゲーム理論において最も影響力のある解の1つである。コンピュータ科学と人工知能の発展に伴い、ナッシュ均衡計算への需要が高まっている。本稿では, 有限正規形式ゲームにおけるナッシュ均衡とその近似解の計算アルゴリズムについて, 理論的, 経験的両面から検討する。
論文参考訳（メタデータ） (2023-12-18T10:00:47Z)
A Black-box Approach for Non-stationary Multi-agent Reinforcement Learning [53.83345471268163]
非定常マルチエージェントシステムにおける平衡の学習について検討する。単エージェント学習へのブラックボックス還元による様々な平衡の検証方法を示す。
論文参考訳（メタデータ） (2023-06-12T23:48:24Z)
Differentiable Arbitrating in Zero-sum Markov Games [59.62061049680365]
ゼロサムマルコフゲームにおいて、2人のプレイヤーが望ましいナッシュ均衡、すなわち仲裁を誘導する報酬を摂動する方法を研究する。低いレベルでは、与えられた報酬関数の下でのナッシュ均衡の解決が必要であり、それによって全体的な問題をエンドツーエンドで最適化することが難しくなる。上層階の勾配フィードバックを提供するナッシュ平衡を微分するバックプロパゲーション方式を提案する。
論文参考訳（メタデータ） (2023-02-20T16:05:04Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
Multiplayer Performative Prediction: Learning in Decision-Dependent Games [18.386569111954213]
本稿では,マルチプレイヤー演奏予測のための新たなゲーム理論の枠組みを定式化する。我々は、(i)パフォーマンス的に安定な平衡と(ii)ゲームのナッシュ平衡という、2つの異なる解の概念に焦点を当てる。軽微な仮定の下では、様々なアルゴリズムにより、性能的に安定な平衡を効率的に見つけることができることを示す。
論文参考訳（メタデータ） (2022-01-10T15:31:10Z)
Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。我々はNash equilibria(NE)の解の概念に焦点をあてる。このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文参考訳（メタデータ） (2021-11-07T21:15:35Z)
Sample-Efficient Learning of Stackelberg Equilibria in General-Sum Games [78.65798135008419]
一般的なゲームでStackelberg平衡を効率的に学習する方法は、サンプルから非常にオープンなままです。本稿では,2プレーヤターンベース汎用ゲームにおけるStackelberg平衡のサンプル効率学習に関する理論的研究を開始する。
論文参考訳（メタデータ） (2021-02-23T05:11:07Z)
No-regret learning and mixed Nash equilibria: They do not mix [64.37511607254115]
我々はFTRL(Follow-the-regularized-leader)のダイナミクスについて検討する。厳密でないナッシュ均衡は、FTRLの下で安定して引き寄せることは不可能である。この結果は,学習過程の結果を予測する上で重要な意味を持つ。
論文参考訳（メタデータ） (2020-10-19T13:49:06Z)
Algorithm for Computing Approximate Nash Equilibrium in Continuous Games with Application to Continuous Blotto [1.7132914341329848]
連続ゲームにおけるナッシュ均衡戦略を近似する新しいアルゴリズムを提案する。また,2プレイヤーゼロサムゲームに加えて,マルチプレイヤーゲームや不完全な情報を持つゲームにも適用できる。
論文参考訳（メタデータ） (2020-06-12T19:53:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。