Fugu-MT 論文翻訳(概要): Ordinal Potential-based Player Rating

論文の概要: Ordinal Potential-based Player Rating

arxiv url: http://arxiv.org/abs/2306.05366v2
Date: Wed, 18 Oct 2023 13:48:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-19 13:10:12.803047
Title: Ordinal Potential-based Player Rating
Title（参考訳）: 正規電位に基づくプレイヤーレーティング
Authors: Nelson Vadori and Rahul Savani
Abstract要約: 適切な空間で計算した場合、エロ評価が推移性を保つことを示す。我々は,ゲームのサインパターンを優先する新たなゲーム分解を導入する。我々は,従来のサインランクの概念にアプローチをリンクし,実世界のゲームから,おもちゃの例と経験的データの両方を用いて方法論を評価した。
参考スコア（独自算出の注目度）: 6.454304238638547
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: It was recently observed that Elo ratings fail at preserving transitive relations among strategies and therefore cannot correctly extract the transitive component of a game. We provide a characterization of transitive games as a weak variant of ordinal potential games and show that Elo ratings actually do preserve transitivity when computed in the right space, using suitable invertible mappings. Leveraging this insight, we introduce a new game decomposition of an arbitrary game into transitive and cyclic components that is learnt using a neural network-based architecture and that prioritises capturing the sign pattern of the game, namely transitive and cyclic relations among strategies. We link our approach to the known concept of sign-rank, and evaluate our methodology using both toy examples and empirical data from real-world games.
Abstract（参考訳）: 近年、エロレーティングは戦略間の推移的関係を保つことに失敗し、ゲームの推移的要素を正しく抽出できないことが観測された。順序ポテンシャルゲームの弱い変種としての推移ゲームの特徴を示し、適切な可逆写像を用いて、正しい空間で計算された場合の移動性が実際に維持されることを示す。この知見を生かして,ニューラルネットワークアーキテクチャを用いて学習し,戦略間の推移的および循環的関係であるゲームの符号パターンを優先的に捉える,推移的および循環的要素に任意のゲームの新たなゲーム分解を導入する。我々は,従来のサインランクの概念にアプローチをリンクし,実世界のゲームからの経験的データとおもちゃの例を用いて方法論を評価する。

関連論文リスト

Online Learning of Counter Categories and Ratings in PvP Games [10.432891534204947]
本稿では,Elo原則を拡張したオンライン更新アルゴリズムを提案する。提案手法は,各試合後の評価と対応関係を動的に調整し,不透過性に対処しながらスカラー評価の説明可能性を維持する。
論文参考訳（メタデータ） (2025-02-06T11:57:18Z)
Auto-Encoding Bayesian Inverse Games [36.06617326128679]
ゲームの性質が不明な逆ゲーム問題を考える。既存の最大推定手法は、未知のパラメータの点推定のみを提供する。ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文参考訳（メタデータ） (2024-02-14T02:17:37Z)
Finding mixed-strategy equilibria of continuous-action games without gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文参考訳（メタデータ） (2022-11-29T05:16:41Z)
Game Theoretic Rating in N-player general-sum games with Equilibria [26.166859475522106]
そこで我々は,N-playerに適した新しいアルゴリズムを提案する。これにより、平衡のような確立された解の概念を利用でき、複雑な戦略的相互作用を持つゲームにおける戦略を効率的に評価することができる。
論文参考訳（メタデータ） (2022-10-05T12:33:03Z)
Learning Correlated Equilibria in Mean-Field Games [62.14589406821103]
我々は平均場相関と粗相関平衡の概念を発展させる。ゲームの構造に関する仮定を必要とせず,効率よくゲーム内で学習できることが示される。
論文参考訳（メタデータ） (2022-08-22T08:31:46Z)
Understanding Game-Playing Agents with Natural Language Annotations [34.66200889614538]
本稿では,Goの10万個の人手による注釈付きゲームを含む新しいデータセットを提案する。モデル解釈可能性のためのツールとして、これらの自然言語アノテーションをどのように利用できるかを示す。
論文参考訳（メタデータ） (2022-04-15T16:11:08Z)
Modelling Adversarial Noise for Adversarial Defense [96.56200586800219]
敵の防御は、通常、敵の音を除去したり、敵の頑強な目標モデルを訓練するために、敵の例を活用することに焦点を当てる。逆データと自然データの関係は、逆データからクリーンデータを推測し、最終的な正しい予測を得るのに役立ちます。本研究では, ラベル空間の遷移関係を学習するために, 逆方向の雑音をモデル化し, 逆方向の精度を向上させることを目的とした。
論文参考訳（メタデータ） (2021-09-21T01:13:26Z)
An Empirical Study on the Generalization Power of Neural Representations Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文参考訳（メタデータ） (2021-01-31T10:30:48Z)
Deep Reinforcement Learning with Stacked Hierarchical Attention for Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文参考訳（メタデータ） (2020-10-22T12:40:22Z)
Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文参考訳（メタデータ） (2020-07-10T09:33:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。