論文の概要: Simplified Kalman filter for online rating: one-fits-all approach
- arxiv url: http://arxiv.org/abs/2104.14012v1
- Date: Wed, 28 Apr 2021 20:44:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 01:14:08.376611
- Title: Simplified Kalman filter for online rating: one-fits-all approach
- Title(参考訳): kalman filter for online rating: one-fits-all approach
- Authors: Leszek Szczecinski and Rapha\"elle Tihon
- Abstract要約: 私たちは、選手/チームのスキルがゲームの観察された結果から推測されるスポーツのレーティングの問題に対処します。
本研究は,ゲーム結果とスキルの関係の確率的モデルを利用して,新たなゲーム後のスキルを推定するオンライン評価アルゴリズムに着目した。
- 参考スコア(独自算出の注目度): 4.010371060637208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we deal with the problem of rating in sports, where the skills
of the players/teams are inferred from the observed outcomes of the games. Our
focus is on the online rating algorithms which estimate the skills after each
new game by exploiting the probabilistic models of the relationship between the
skills and the game outcome. We propose a Bayesian approach which may be seen
as an approximate Kalman filter and which is generic in the sense that it can
be used with any skills-outcome model and can be applied in the individual --
as well as in the group-sports. We show how the well-know algorithms (such as
the Elo, the Glicko, and the TrueSkill algorithms) may be seen as instances of
the one-fits-all approach we propose. In order to clarify the conditions under
which the gains of the Bayesian approach over the simpler solutions can
actually materialize, we critically compare the known and the new algorithms by
means of numerical examples using the synthetic as well as the empirical data.
- Abstract(参考訳): 本研究では,スポーツにおける評価の問題に対処し,選手/チームのスキルをゲームの結果から推定する。
本研究は,ゲーム結果とスキルの関係の確率的モデルを利用して,新たなゲーム後のスキルを推定するオンライン評価アルゴリズムに着目した。
近似カルマンフィルタと見なすことができ、任意のスキル・アウトカムモデルで使用でき、個人でもグループ・スポーツでも適用できるという意味では一般的であるベイズ的アプローチを提案する。
我々は、Elo、Glicko、TrueSkillアルゴリズムのような知識の豊富なアルゴリズムが、我々が提案するオールワンフィットアプローチの例と見なすことができることを示す。
ベイズ法がより単純な解に対して実際に得られる条件を明らかにするために, 実験データと同様に合成を用いた数値例を用いて, 既知のアルゴリズムと新しいアルゴリズムを批判的に比較する。
関連論文リスト
- FIVB ranking: Misstep in the right direction [1.4419517737536705]
この研究は統計フレームワークを使用して、F'ed'eration Internationale de Volleyball (FIVB)が2020年から使用しているランキングアルゴリズムを提示し、評価している。
FIVBランキングの健全な特徴は確率モデルを使用することであり、これは今後のゲームの確率を明示的に計算する。
論文 参考訳(メタデータ) (2024-08-02T23:46:55Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Hardness of Independent Learning and Sparse Equilibrium Computation in
Markov Games [70.19141208203227]
マルコフゲームにおける分散型マルチエージェント強化学習の問題点を考察する。
我々は,全てのプレイヤーが独立に実行すると,一般のサムゲームにおいて,アルゴリズムが到達しないことを示す。
我々は,全てのエージェントが集中型アルゴリズムによって制御されるような,一見簡単な設定であっても,下位境界が保持されていることを示す。
論文 参考訳(メタデータ) (2023-03-22T03:28:12Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - FIFA ranking: Evaluation and path forward [2.050873301895484]
現在使われているパラメータを分析し、そこから導出可能な形式的確率モデルを示し、後者を最適化する。
我々は、1970年に提案されたデービッドソンモデルが優れた候補となるフォーマルなモデリング原理に根ざしたアルゴリズムを仮定する。
その結果,ホームフィールド・アドバンテージとゲーム中のドローの明示的モデルを用いて,アルゴリズムの予測能力が顕著に向上していることが示唆された。
論文 参考訳(メタデータ) (2021-12-20T21:08:12Z) - Contextual Games: Multi-Agent Learning with Side Information [57.76996806603094]
各ラウンドでコンテキスト情報によって駆動されるコンテキストゲームの新しいクラスを定式化する。
カーネルベースの規則性仮定を用いて、異なるコンテキストとゲーム結果の相関関係をモデル化する。
本研究では,個々のプレイヤーの文脈的後悔を最小限に抑えるために,そのような相関を利用した新しいオンライン(メタ)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-13T18:37:37Z) - G-Elo: Generalization of the Elo algorithm by modelling the discretized
margin of victory [2.050873301895484]
ゲームポイント(ゴールなど)の観測値の違いを利用して,1対1のゲームにおける評価チーム(またはプレーヤ)の新たなアルゴリズムを開発する。
本研究の目的は,実装が簡単で直感的に理解できるEloスタイルのアルゴリズムを得ることである。
論文 参考訳(メタデータ) (2020-10-20T03:55:30Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Efficient Competitive Self-Play Policy Optimization [20.023522000925094]
対戦型ゼロサムゲームにおける対戦型自己演奏強化学習のための新しいアルゴリズムフレームワークを提案する。
本手法は,複数のエージェントを同時に訓練し,単純な対戦ルールに基づいて知的に互いに相手として取り合う。
我々は,このアルゴリズムが凸凹ゲームにおいて高い確率で近似平衡に収束することを理論的に証明する。
論文 参考訳(メタデータ) (2020-09-13T21:01:38Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。