論文の概要: Score-Driven Rating System for Sports
- arxiv url: http://arxiv.org/abs/2604.09143v1
- Date: Fri, 10 Apr 2026 09:22:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.795902
- Title: Score-Driven Rating System for Sports
- Title(参考訳): スポーツのためのスコア駆動型レーティングシステム
- Authors: Vladimír Holý, Michal Černý,
- Abstract要約: 本稿では,古典的エロ格付けシステムの一般化であるスコア駆動型格付けシステムを紹介する。
提案するフレームワークは,点差,勝/敗/敗,完備ランキングなど,幅広いゲーム結果に対応している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a score-driven rating system, a generalization of the classical Elo rating system that employs the score, i.e. the gradient of the log-likelihood, as the updating mechanism for player and team ratings. The proposed framework extends beyond simple win/loss game outcomes and accommodates a wide range of game results, such as point differences, win/draw/loss outcomes, or complete rankings. Theoretical properties of the score are derived, showing that it has zero expected value, sums to zero across all players, and decreases with increasing value of a player's rating, thereby ensuring internal consistency and fairness. Furthermore, the score-driven rating system exhibits a reversion property, meaning that ratings tend to follow the underlying unobserved true skills over time. The proposed framework provides a theoretical rationale for existing dynamic models of sports performance and offers a systematic approach for constructing new ones.
- Abstract(参考訳): 本稿では,古典的エロ格付けシステムの一般化であるスコア駆動格付けシステムを導入する。
提案したフレームワークは、単純な勝敗ゲーム結果を超えて、ポイント差、勝敗/敗退結果、完全ランキングなどの幅広いゲーム結果に対応している。
スコアの理論的特性は、期待値がゼロであり、すべてのプレイヤーにゼロまで合計され、プレイヤーのレーティングの値が増加するにつれて減少し、内部の一貫性と公平性を確保することを示し、導出される。
さらに、スコア駆動型レーティングシステムは、リバージョン特性を示し、つまり、評価は、時間とともに、根底にある観測されていない真のスキルに従う傾向にある。
提案フレームワークは,既存のスポーツパフォーマンスの動的モデルに対する理論的理論的根拠を提供し,新しいモデルを構築するための体系的なアプローチを提供する。
関連論文リスト
- Who is a Better Player: LLM against LLM [53.46608216197315]
本稿では,大規模言語モデル (LLM) の総合的な性能を評価するための対戦型ベンチマークフレームワークを提案する。
広範にプレイされている5つのゲームをサポートし,20のLDMを駆使したプレーヤーを対象とする,特別な評価プラットフォームであるQi Townを紹介した。
論文 参考訳(メタデータ) (2025-08-05T06:41:47Z) - RAG-Zeval: Towards Robust and Interpretable Evaluation on RAG Responses through End-to-End Rule-Guided Reasoning [64.46921169261852]
RAG-Zevalは、ルール誘導推論タスクとして忠実さと正しさの評価を定式化する、新しいエンドツーエンドフレームワークである。
提案手法は、強化学習による評価者を訓練し、コンパクトなモデルにより包括的および音質評価を生成する。
実験では、RAG-Zevalの優れた性能を示し、人間の判断と最も強い相関性を達成した。
論文 参考訳(メタデータ) (2025-05-28T14:55:33Z) - Validating LLM-as-a-Judge Systems under Rating Indeterminacy [65.137380612741]
評価の不確定性の下でLLM-as-a-judgeシステムを検証するための枠組みを提案する。
本研究では, 強制選択評価指示に応答する際の評価の不確定性を人間とLLMがどう解決するかの相違が, 偏見の検証に大きく寄与することを示した。
論文 参考訳(メタデータ) (2025-03-07T22:09:47Z) - Re-evaluating Open-ended Evaluation of Large Language Models [50.23008729038318]
現在のEloベースのレーティングシステムは、データ、意図的、あるいは偶発的なバイアスの影響を受けやすく、さらに強化できることを示している。
本稿では,3人プレイヤゲームとしての評価を提案し,冗長性に対するロバスト性を確保するために,ゲーム理論の新たな概念を導入する。
論文 参考訳(メタデータ) (2025-02-27T15:07:47Z) - Analytical and Empirical Study of Herding Effects in Recommendation Systems [72.6693986712978]
評価アグリゲーションルールとショートリストされた代表レビューを用いて製品評価を管理する方法について検討する。
本稿では,Amazon と TripAdvisor の収束速度を向上させるために,適切な信頼度評価アグリゲーションルールが有効であることを示す。
論文 参考訳(メタデータ) (2024-08-20T14:29:23Z) - Counter-Empirical Attacking based on Adversarial Reinforcement Learning
for Time-Relevant Scoring System [22.86575572172689]
そこで我々は,評価システムの経験則を破ろうとする「攻撃的攻撃」機構を提案する。
対人学習問題を訓練することにより、経験的基準を破ろうとする攻撃活動トレースに対して、適切なスコアリング機能が堅牢であることを学ぶことができる。
論文 参考訳(メタデータ) (2023-11-09T04:49:41Z) - Behavioral Player Rating in Competitive Online Shooter Games [3.203973145772361]
本稿では,ゲーム内統計学からモデルプレイヤへのいくつかの特徴を設計し,その振る舞いと真のパフォーマンスレベルを正確に表現するレーティングを作成する。
その結果, 動作評価は, 生成した表現の解釈可能性を維持しつつ, より正確な性能評価を示すことがわかった。
プレイヤーのプレイ行動の異なる側面を考慮し、マッチメイキングに行動評価を使用すると、プレイヤーのゴールや関心とより一致したマッチアップにつながる可能性がある。
論文 参考訳(メタデータ) (2022-07-01T16:23:01Z) - The Evaluation of Rating Systems in Team-based Battle Royale Games [4.168733556014873]
本稿では,25,000人以上のチームバトルロイヤルマッチのリアルタイムデータセット上で,3つの人気評価システムを評価するためのいくつかの指標の有用性について検討する。
正規化割引累積ゲイン (NDCG) は信頼性が高く, 柔軟性が高かった。
論文 参考訳(メタデータ) (2021-05-28T19:22:07Z) - An Elo-like System for Massive Multiplayer Competitions [1.8782750537161612]
参加者数の多いコンテストを対象とした新しいベイズ評価システムを提案する。
それは離散的なランク付けされたマッチの競争のフォーマットに広く適当です。
システムにはインセンティブが整い、すなわち、格付けを最大化しようとするプレイヤーは、決してパフォーマンスを損なうことはない。
論文 参考訳(メタデータ) (2021-01-02T08:14:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。