論文の概要: On the Limitations of Elo: Real-World Games, are Transitive, not
Additive
- arxiv url: http://arxiv.org/abs/2206.12301v1
- Date: Tue, 21 Jun 2022 22:07:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 01:22:52.587860
- Title: On the Limitations of Elo: Real-World Games, are Transitive, not
Additive
- Title(参考訳): Eloの限界について:実世界ゲームは過渡的であり、加法的ではない
- Authors: Quentin Bertrand, Wojciech Marian Czarnecki, Gauthier Gidel
- Abstract要約: Eloモデルはゲーム内の推移成分の強みを抽出できないことを示す。
本稿では,各プレイヤーに2つのスコアを割り当てるEloスコアの拡張を提案する。
- 参考スコア(独自算出の注目度): 13.334776744099285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world competitive games, such as chess, go, or StarCraft II, rely on Elo
models to measure the strength of their players. Since these games are not
fully transitive, using Elo implicitly assumes they have a strong transitive
component that can correctly be identified and extracted. In this study, we
investigate the challenge of identifying the strength of the transitive
component in games. First, we show that Elo models can fail to extract this
transitive component, even in elementary transitive games. Then, based on this
observation, we propose an extension of the Elo score: we end up with a disc
ranking system that assigns each player two scores, which we refer to as skill
and consistency. Finally, we propose an empirical validation on payoff matrices
coming from real-world games played by bots and humans.
- Abstract(参考訳): チェス、go、starcraft iiといった現実世界の競争ゲームは、プレイヤーの強さを測定するためにeloモデルに依存している。
これらのゲームは完全推移的ではないので、エロは暗黙的にそれらが正しく識別され抽出できる強い推移成分を持っていると仮定する。
本研究では,ゲームにおける推移成分の強度を同定する課題について検討する。
まず,初等推移ゲームにおいても,エロモデルがこの推移成分を抽出できないことを示す。
次に、この観察に基づいてeloスコアの拡張を提案する。 最終的には、各プレイヤーに2つのスコアを割り当てるディスクランキングシステムを作成し、それをスキルと一貫性と呼ぶ。
最後に,ロボットと人間による実世界のゲームから得られるペイオフ行列の実証的検証を提案する。
関連論文リスト
- Human-aligned Chess with a Bit of Search [35.16633353273246]
チェスは長年、AIが人間の知性と一致しようとする試みの場だった。
本稿では,この古典的なゲームにおいて,人工知能と人間の知能のギャップを埋めるために設計されたチェスをプレイするAIであるAllieを紹介する。
論文 参考訳(メタデータ) (2024-10-04T19:51:03Z) - Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - Ordinal Potential-based Player Rating [6.454304238638547]
適切な空間で計算した場合、エロ評価が推移性を保つことを示す。
我々は,ゲームのサインパターンを優先する新たなゲーム分解を導入する。
我々は,従来のサインランクの概念にアプローチをリンクし,実世界のゲームから,おもちゃの例と経験的データの両方を用いて方法論を評価した。
論文 参考訳(メタデータ) (2023-06-08T17:08:52Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - Emergent Communication: Generalization and Overfitting in Lewis Games [53.35045559317384]
ルイスシグナリングゲーム(Lewis signaling game)は、言語の出現をシミュレートする単純なコミュニケーションゲームの一種である。
これらのゲームでは、2人のエージェントが協調的なタスクを解決するために通信プロトコルに合意しなければなりません。
これまでの研究によると、強化学習でこのゲームをプレイするように訓練されたエージェントは、望ましくない性質を示す言語を開発する傾向がある。
論文 参考訳(メタデータ) (2022-09-30T09:50:46Z) - GCN-WP -- Semi-Supervised Graph Convolutional Networks for Win
Prediction in Esports [84.55775845090542]
本稿では,グラフ畳み込みネットワークに基づくエスポートに対する半教師付き勝利予測モデルを提案する。
GCN-WPはマッチとプレーヤに関する30以上の機能を統合し、近隣のゲームを分類するためにグラフ畳み込みを使用している。
本モデルは,LLの機械学習やスキル評価モデルと比較して,最先端の予測精度を実現する。
論文 参考訳(メタデータ) (2022-07-26T21:38:07Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Learning to Identify Top Elo Ratings: A Dueling Bandits Approach [27.495132915328025]
我々は,Elo評価(トッププレイヤー)のサンプル効率を改善するために,効率的なオンラインマッチングスケジューリングアルゴリズムを提案する。
具体的には、上位プレイヤーをデュエルバンドフレームワークで識別し、Eloの勾配ベースの更新に合わせてバンディットアルゴリズムを調整する。
我々のアルゴリズムは、競合ラウンドの数で$tildeO(sqrtT)$, sublinearを保証しており、多次元エロ評価にまで拡張されている。
論文 参考訳(メタデータ) (2022-01-12T13:57:29Z) - Elo Ratings for Large Tournaments of Software Agents in Asymmetric Games [0.0]
alphago zeroによる5185のレーティングのような、人間と同じeloスケールの人工知能エージェントを評価するのは自然である。
人間とAIの間には、システムの変更を提案する基本的な違いがいくつかある。
本稿では,これらの違いを反映したリフレッシュレーティングシステムとトーナメントのガイドラインを提案する。
論文 参考訳(メタデータ) (2021-04-23T21:49:20Z) - ELO System for Skat and Other Games of Chance [1.3706331473063877]
ELOランキングシステムは、ゼロサムゲームにおけるプレイヤーの相対スキルレベルを計算する信頼できる方法であることが証明されています。
しかし、skatやbridgeのようなトリックテイクカードゲームにおけるプレイヤーの強さの評価は明らかではない。
これらの弱点を克服するための新しいELOシステムを提案します。
論文 参考訳(メタデータ) (2021-04-07T08:30:01Z) - An Empirical Study on the Generalization Power of Neural Representations
Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。
提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文 参考訳(メタデータ) (2021-01-31T10:30:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。