論文の概要: Online Learning of Counter Categories and Ratings in PvP Games
- arxiv url: http://arxiv.org/abs/2502.03998v1
- Date: Thu, 06 Feb 2025 11:57:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:33:18.947183
- Title: Online Learning of Counter Categories and Ratings in PvP Games
- Title(参考訳): PvPゲームにおけるカウンターカテゴリとレーティングのオンライン学習
- Authors: Chiu-Chou Lin, I-Chen Wu,
- Abstract要約: 本稿では,Elo原則を拡張したオンライン更新アルゴリズムを提案する。
提案手法は,各試合後の評価と対応関係を動的に調整し,不透過性に対処しながらスカラー評価の説明可能性を維持する。
- 参考スコア(独自算出の注目度): 10.432891534204947
- License:
- Abstract: In competitive games, strength ratings like Elo are widely used to quantify player skill and support matchmaking by accounting for skill disparities better than simple win rate statistics. However, scalar ratings cannot handle complex intransitive relationships, such as counter strategies seen in Rock-Paper-Scissors. To address this, recent work introduced Neural Rating Table and Neural Counter Table, which combine scalar ratings with discrete counter categories to model intransitivity. While effective, these methods rely on neural network training and cannot perform real-time updates. In this paper, we propose an online update algorithm that extends Elo principles to incorporate real-time learning of counter categories. Our method dynamically adjusts both ratings and counter relationships after each match, preserving the explainability of scalar ratings while addressing intransitivity. Experiments on zero-sum competitive games demonstrate its practicality, particularly in scenarios without complex team compositions.
- Abstract(参考訳): 競争ゲームにおいて、Eloのような強度評価は、単純な勝利率統計よりも優れたスキル格差を考慮し、プレイヤーのスキルを定量化し、マッチメイキングをサポートするために広く使用されている。
しかし、スカラー評価は、ロック・パパー・シッソールに見られるカウンター戦略のような複雑な非推移的な関係を扱えない。
この問題に対処するため、最近の研究では、スカラーレーティングと離散カウンタカテゴリを組み合わせた非透過性をモデル化するニューラルレーティングテーブルとニューラルカウンタテーブルを導入している。
効果はあるものの、これらの手法はニューラルネットワークのトレーニングに依存しており、リアルタイム更新を実行できない。
本稿では,Eloの原理を拡張したオンライン更新アルゴリズムを提案する。
提案手法は,各試合後の評価と対応関係を動的に調整し,不透過性に対処しながらスカラー評価の説明可能性を維持する。
ゼロサム競争ゲームの実験は、特に複雑なチーム構成を持たないシナリオにおいて、その実用性を実証している。
関連論文リスト
- Identifying and Clustering Counter Relationships of Team Compositions in PvP Games for Efficient Balance Analysis [24.683917771144536]
ゼロサム競争シナリオにおけるバランスを定量化する尺度を開発する。
我々は、合成の有用なカテゴリを特定し、それらのカウンター関係をピンポイントする。
私たちのフレームワークは、Eage of Empires II、Hearthstone、Brawl Stars、League of Legendsなど、人気のあるオンラインゲームで検証されています。
論文 参考訳(メタデータ) (2024-08-30T10:28:36Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Ordinal Potential-based Player Rating [6.454304238638547]
適切な空間で計算した場合、エロ評価が推移性を保つことを示す。
我々は,ゲームのサインパターンを優先する新たなゲーム分解を導入する。
我々は,従来のサインランクの概念にアプローチをリンクし,実世界のゲームから,おもちゃの例と経験的データの両方を用いて方法論を評価した。
論文 参考訳(メタデータ) (2023-06-08T17:08:52Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Nash Equilibria and Pitfalls of Adversarial Training in Adversarial
Robustness Games [51.90475640044073]
本研究では,2プレイヤゼロサムゲームにおける最適応答戦略の交互化として,対戦訓練について検討する。
一方、ゲームのユニークな純粋なナッシュ均衡が存在し、確実に堅牢である。
論文 参考訳(メタデータ) (2022-10-23T03:21:01Z) - Behavioral Player Rating in Competitive Online Shooter Games [3.203973145772361]
本稿では,ゲーム内統計学からモデルプレイヤへのいくつかの特徴を設計し,その振る舞いと真のパフォーマンスレベルを正確に表現するレーティングを作成する。
その結果, 動作評価は, 生成した表現の解釈可能性を維持しつつ, より正確な性能評価を示すことがわかった。
プレイヤーのプレイ行動の異なる側面を考慮し、マッチメイキングに行動評価を使用すると、プレイヤーのゴールや関心とより一致したマッチアップにつながる可能性がある。
論文 参考訳(メタデータ) (2022-07-01T16:23:01Z) - Poisoning Attack against Estimating from Pairwise Comparisons [140.9033911097995]
攻撃者はランクリストを操作するための強い動機と動機を持っている。
ペアワイズランキングアルゴリズムに対するデータ中毒攻撃は、ローダとアタッカーの間の動的および静的ゲームとして形式化することができる。
本稿では、2つの効率的な毒殺攻撃アルゴリズムを提案し、関連する理論的保証を確立する。
論文 参考訳(メタデータ) (2021-07-05T08:16:01Z) - Evaluating Team Skill Aggregation in Online Competitive Games [4.168733556014873]
本稿では,2つの新しい集計手法が評価システムの予測性能に与える影響について分析する。
以上の結果から,テストケースの大部分において,MAX法が他の2手法よりも優れていることが示された。
本研究の結果は,チームのパフォーマンスを計算するために,より精巧な手法を考案する必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2021-06-21T20:17:36Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Competitive Balance in Team Sports Games [8.321949054700086]
最終的なスコア差を用いることで,競争バランスの予測基準がさらに向上することを示す。
また、慎重に選択されたチームと個々の特徴に基づいて訓練された線形モデルが、より強力なニューラルネットワークモデルの性能をほぼ達成できることも示している。
論文 参考訳(メタデータ) (2020-06-24T14:19:07Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。