論文の概要: The Evaluation of Rating Systems in Team-based Battle Royale Games
- arxiv url: http://arxiv.org/abs/2105.14069v1
- Date: Fri, 28 May 2021 19:22:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 17:01:14.538058
- Title: The Evaluation of Rating Systems in Team-based Battle Royale Games
- Title(参考訳): チームベースバトルロイヤルゲームにおけるレーティングシステムの評価
- Authors: Arman Dehpanah, Muheeb Faizan Ghori, Jonathan Gemmell, Bamshad
Mobasher
- Abstract要約: 本稿では,25,000人以上のチームバトルロイヤルマッチのリアルタイムデータセット上で,3つの人気評価システムを評価するためのいくつかの指標の有用性について検討する。
正規化割引累積ゲイン (NDCG) は信頼性が高く, 柔軟性が高かった。
- 参考スコア(独自算出の注目度): 4.168733556014873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online competitive games have become a mainstream entertainment platform. To
create a fair and exciting experience, these games use rating systems to match
players with similar skills. While there has been an increasing amount of
research on improving the performance of these systems, less attention has been
paid to how their performance is evaluated. In this paper, we explore the
utility of several metrics for evaluating three popular rating systems on a
real-world dataset of over 25,000 team battle royale matches. Our results
suggest considerable differences in their evaluation patterns. Some metrics
were highly impacted by the inclusion of new players. Many could not capture
the real differences between certain groups of players. Among all metrics
studied, normalized discounted cumulative gain (NDCG) demonstrated more
reliable performance and more flexibility. It alleviated most of the challenges
faced by the other metrics while adding the freedom to adjust the focus of the
evaluations on different groups of players.
- Abstract(参考訳): オンライン競争ゲームは主流のエンターテイメントプラットフォームになっている。
公平でエキサイティングな体験を生み出すために、これらのゲームはレーティングシステムを使用してプレイヤーに類似したスキルをマッチさせる。
これらのシステムの性能改善に関する研究が増えているが、その性能評価にはあまり注意が払われていない。
本稿では,チームバトルロイヤルマッチ25,000以上の実世界データセット上で,人気のある3つのレーティングシステムを評価するための,いくつかの指標の有用性について検討する。
その結果,評価パターンにかなりの違いが認められた。
いくつかの指標は、新しいプレイヤーの追加によって大きな影響を受けました。
多くのプレイヤーは特定のグループ間の実際の違いを捉えられなかった。
その結果,正規化割引累積ゲイン(NDCG)は信頼性が高く,柔軟性が向上した。
他のメトリクスが直面する課題の大部分を緩和し、異なるプレイヤーグループに対する評価の焦点を調整する自由を追加した。
関連論文リスト
- CUPID: Improving Battle Fairness and Position Satisfaction in Online MOBA Games with a Re-matchmaking System [38.36310386543932]
CUPIDは、フェアネスとプレイヤーの満足度の両方を改善するために、チームとポジションの割り当てを最適化することを目的としている。
マッチング品質の最小レベルを確保するために、事前フィルタリングのステップを組み込んだ後、事前マッチの勝利率予測モデルが続く。
CUPIDの有効性を検証するために、2つの大規模な実世界のMOBAデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-06-28T08:09:55Z) - Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - GameEval: Evaluating LLMs on Conversational Games [93.40433639746331]
大規模言語モデル(LLM)を評価する新しいアプローチであるGameEvalを提案する。
GameEvalはLSMをゲームプレイヤーとして扱い、様々な形式の会話を起動することで達成した特定の目標にそれぞれ異なる役割を割り当てる。
我々は,GameEvalが様々なLLMの能力を効果的に差別化することができ,複雑な問題を解決するための統合能力を総合的に評価できることを示した。
論文 参考訳(メタデータ) (2023-08-19T14:33:40Z) - Behavioral Player Rating in Competitive Online Shooter Games [3.203973145772361]
本稿では,ゲーム内統計学からモデルプレイヤへのいくつかの特徴を設計し,その振る舞いと真のパフォーマンスレベルを正確に表現するレーティングを作成する。
その結果, 動作評価は, 生成した表現の解釈可能性を維持しつつ, より正確な性能評価を示すことがわかった。
プレイヤーのプレイ行動の異なる側面を考慮し、マッチメイキングに行動評価を使用すると、プレイヤーのゴールや関心とより一致したマッチアップにつながる可能性がある。
論文 参考訳(メタデータ) (2022-07-01T16:23:01Z) - Collusion Detection in Team-Based Multiplayer Games [57.153233321515984]
チームベースのマルチプレイヤーゲームにおいて,協調動作を検出するシステムを提案する。
提案手法は,ゲーム内行動パターンと組み合わせたプレイヤーの社会的関係を解析する。
次に,非教師なし学習手法であるアイソレーションフォレストによる検出を自動化する。
論文 参考訳(メタデータ) (2022-03-10T02:37:39Z) - Player Modeling using Behavioral Signals in Competitive Online Games [4.168733556014873]
本稿では,マッチング作成のためのプレイヤーのモデリングにおいて,演奏行動の異なる側面に対処することの重要性に焦点をあてる。
75,000以上のバトルロイヤルマッチのデータセットからいくつかの行動特性を設計し、プレイヤーモデルを作成しました。
次に、作成したモデルを使用して、データ内のさまざまなプレイヤーのグループのランクを予測します。
論文 参考訳(メタデータ) (2021-11-29T22:53:17Z) - Evaluating Team Skill Aggregation in Online Competitive Games [4.168733556014873]
本稿では,2つの新しい集計手法が評価システムの予測性能に与える影響について分析する。
以上の結果から,テストケースの大部分において,MAX法が他の2手法よりも優れていることが示された。
本研究の結果は,チームのパフォーマンスを計算するために,より精巧な手法を考案する必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2021-06-21T20:17:36Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - An Empirical Study on the Generalization Power of Neural Representations
Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。
提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文 参考訳(メタデータ) (2021-01-31T10:30:48Z) - An Elo-like System for Massive Multiplayer Competitions [1.8782750537161612]
参加者数の多いコンテストを対象とした新しいベイズ評価システムを提案する。
それは離散的なランク付けされたマッチの競争のフォーマットに広く適当です。
システムにはインセンティブが整い、すなわち、格付けを最大化しようとするプレイヤーは、決してパフォーマンスを損なうことはない。
論文 参考訳(メタデータ) (2021-01-02T08:14:31Z) - Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てる。
本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人的視点から変えられるかを検討することを目的とする。
論文 参考訳(メタデータ) (2020-11-02T21:54:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。