論文の概要: A Characterization of Perfect Strategies for Mirror Games
- arxiv url: http://arxiv.org/abs/2302.04557v2
- Date: Mon, 8 May 2023 02:09:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 23:10:33.808845
- Title: A Characterization of Perfect Strategies for Mirror Games
- Title(参考訳): ミラーゲームのための完璧な戦略のキャラクタリゼーション
- Authors: Sizhuo Yan, Jianting Yang, Tianshi Yu, Lihong Zhi
- Abstract要約: ミラーゲームとユニバーサルゲーム代数を関連付け、*-表現を用いて量子可換作用素戦略を記述する。
ミラーゲームが完全可換演算子戦略を持たないことを証明するために、非可換Gr"オブナー基底計算と半定値プログラミングに基づくアルゴリズムが与えられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We associate mirror games with the universal game algebra and use the
*-representation to describe quantum commuting operator strategies. We provide
an algebraic characterization of whether or not a mirror game has perfect
commuting operator strategies. This new characterization uses a smaller algebra
introduced by Paulsen and others for synchronous games and the noncommutative
Nullstellensatz developed by Cimpric, Helton and collaborators. An algorithm
based on noncommutative Gr\"obner basis computation and semidefinite
programming is given for certifying that a given mirror game has no perfect
commuting operator strategies.
- Abstract(参考訳): 我々はミラーゲームとユニバーサルゲーム代数を関連付け、*表現を用いて量子可換作用素戦略を記述する。
ミラーゲームが完全可換操作戦略を持つか否かの代数的特徴付けを提供する。
この新しいキャラクタリゼーションでは、paulsenらによって導入されたより小さな代数を同期ゲームや、cimpric、helton、collaboratorsによって開発された非可換なnullstellensatzに使用する。
ミラーゲームが完全可換作用素戦略を持たないことを証明するために、非可換Gr\に基づくアルゴリズムと半定値プログラミングが与えられる。
関連論文リスト
- Runtime analysis of a coevolutionary algorithm on impartial combinatorial games [1.104960878651584]
進化的アルゴリズム(CoEA)は、現代人との相互作用に基づいて最強を反復的に選択し、次の世代で両親として選択した個体群を用いて、個体群を進化させる。
しかし,CoEAのゲームプレイへの応用はサイクリングなどの病理的行動のため,実行時のペイオフ状況において特に問題となる。
本稿では,解析の範囲を推し進め,公平なゲームのための最適な戦略を見出す。
この結果はどんな公平なゲームにも当てはまり、多くのゲームでは、インプリッド・バウンドは数の関数として、あるいは準ポリノミアルである。
論文 参考訳(メタデータ) (2024-09-06T10:39:17Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Learning in Stackelberg Games with Non-myopic Agents [60.927889817803745]
そこで本研究では,主役が非筋力的な長寿命エージェントと繰り返し対話するスタックルバーグゲームについて,エージェントの支払関数を知らずに検討する。
我々は、非ミオピックエージェントの存在下での学習を、ミオピックエージェントの存在下で堅牢な帯域最適化に還元する一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2022-08-19T15:49:30Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - Near-Optimal No-Regret Learning for General Convex Games [121.50979258049135]
一般凸およびコンパクト戦略集合に対して後悔が得られることを示す。
我々の力学は、適度にエンハンリフトされた空間上の楽観的な従順化バウンドのインスタンス化にある。
先行結果が適用される特殊な場合であっても、我々のアルゴリズムは最先端の後悔よりも改善される。
論文 参考訳(メタデータ) (2022-06-17T12:58:58Z) - Alternating Mirror Descent for Constrained Min-Max Games [44.46086335474311]
制約付き戦略空間を持つ2プレイヤー双線形ゼロサムゲームについて検討する。
我々は,各プレイヤーが交互に行動する交互ミラー降下アルゴリズムを,制約付き最適化のためのミラー降下アルゴリズムに従って解析する。
論文 参考訳(メタデータ) (2022-06-08T20:48:16Z) - Strategizing against Learners in Bayesian Games [74.46970859427907]
プレイヤーの1人である学習者が無学習の学習戦略を採用する2人プレイヤゲームについて検討した。
一般のベイズゲームでは,学習者と学習者の双方の報酬の支払いが,そのタイプに依存する可能性がある。
論文 参考訳(メタデータ) (2022-05-17T18:10:25Z) - Noncommutative Nullstellens\"atze and Perfect Games [0.0]
古典的代数幾何学と実代数幾何学の基礎は、ヌルサッツとポシティフサッツである。
本稿では,非ローカルゲームにおける通信事業者戦略について述べる。
結果は異なる文献にまたがるので、簡潔であるよりむしろ、我々のスタイルはかなり実証的だ。
論文 参考訳(メタデータ) (2021-11-29T20:05:33Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Discovering Multi-Agent Auto-Curricula in Two-Player Zero-Sum Games [31.97631243571394]
明示的な人間設計なしに更新ルールの発見を自動化するフレームワークであるLMACを導入する。
意外なことに、人間のデザインがなくても、発見されたMARLアルゴリズムは競争力や性能が向上する。
LMAC は,例えば Kuhn Poker のトレーニングやPSRO の成績など,小型ゲームから大規模ゲームへの一般化が可能であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:30:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。