論文の概要: Evaluating Soccer Match Prediction Models: A Deep Learning Approach and
Feature Optimization for Gradient-Boosted Trees
- arxiv url: http://arxiv.org/abs/2309.14807v1
- Date: Tue, 26 Sep 2023 10:05:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 14:15:13.023293
- Title: Evaluating Soccer Match Prediction Models: A Deep Learning Approach and
Feature Optimization for Gradient-Boosted Trees
- Title(参考訳): サッカーマッチ予測モデルの評価:勾配ブースト木に対するディープラーニングアプローチと特徴最適化
- Authors: Calvin Yeung, Rory Bunker, Rikuhei Umemoto, Keisuke Fujii
- Abstract要約: 2023年のサッカーの予測チャレンジでは、まず各チームが得点した正確なゴールについて、次に勝利、引き分け、負けの確率について、試合結果の予測が必要とされた。
CatBoost モデルは pi-ratings を特徴として用いており、これは最初は win/draw/loss 確率を計算するのに最適な選択肢として認識されていた。
本研究では,ディープラーニングモデルの性能を評価し,勾配木モデルに最適な特徴セットを決定することを目的とした。
- 参考スコア(独自算出の注目度): 0.8009842832476994
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning models have become increasingly popular for predicting the
results of soccer matches, however, the lack of publicly-available benchmark
datasets has made model evaluation challenging. The 2023 Soccer Prediction
Challenge required the prediction of match results first in terms of the exact
goals scored by each team, and second, in terms of the probabilities for a win,
draw, and loss. The original training set of matches and features, which was
provided for the competition, was augmented with additional matches that were
played between 4 April and 13 April 2023, representing the period after which
the training set ended, but prior to the first matches that were to be
predicted (upon which the performance was evaluated). A CatBoost model was
employed using pi-ratings as the features, which were initially identified as
the optimal choice for calculating the win/draw/loss probabilities. Notably,
deep learning models have frequently been disregarded in this particular task.
Therefore, in this study, we aimed to assess the performance of a deep learning
model and determine the optimal feature set for a gradient-boosted tree model.
The model was trained using the most recent five years of data, and three
training and validation sets were used in a hyperparameter grid search. The
results from the validation sets show that our model had strong performance and
stability compared to previously published models from the 2017 Soccer
Prediction Challenge for win/draw/loss prediction.
- Abstract(参考訳): 機械学習モデルは、サッカーの試合の結果を予測するためにますます人気になっているが、公開利用可能なベンチマークデータセットの欠如により、モデル評価が困難になっている。
2023年のサッカーの予測チャレンジでは、まず各チームが得点した正確なゴールについて、次に勝利、引き分け、負けの確率について、試合結果の予測が必要とされた。
当初のトレーニングセットは、2023年4月4日から4月13日にかけて追加試合が行われ、トレーニングセットが終了するまでの期間を表すが、予想される最初の試合(パフォーマンスが評価された期間)の前に拡張された。
この特徴としてpi-ratingsを用いたcatboostモデルを採用し,win/draw/loss確率の計算に最適であると考えられた。
特に、ディープラーニングモデルは、この特定のタスクでしばしば無視されている。
そこで本研究では,ディープラーニングモデルの性能を評価し,勾配ブースト木モデルの最適特徴集合を決定することを目的とした。
このモデルは、最新の5年間のデータを用いてトレーニングされ、3つのトレーニングセットと検証セットがハイパーパラメータグリッドサーチに使用された。
検証セットの結果,2017年のサッカー予測チャレンジのwin/draw/loss予測モデルと比較して,モデルの性能と安定性が向上したことがわかった。
関連論文リスト
- Valeo4Cast: A Modular Approach to End-to-End Forecasting [93.86257326005726]
我々のソリューションはArgoverse 2 end-to-end Forecasting Challengeで63.82 mAPfでランクインした。
私たちは、知覚から予測までエンドツーエンドのトレーニングを通じて、このタスクに取り組む現在のトレンドから離れ、代わりにモジュラーアプローチを使用します。
私たちは、昨年の優勝者より+17.1ポイント、今年の優勝者より+13.3ポイント、予測結果を+17.1ポイント上回る。
論文 参考訳(メタデータ) (2024-06-12T11:50:51Z) - On Training Survival Models with Scoring Rules [9.330089124239086]
本研究は,評価ではなく,スコアリングルールを用いたモデルトレーニングについて検討する。
我々は、モデル非依存の生存モデルを訓練するための一般的なフレームワークを構築し、パラメトリックまたは非パラメトリックのイベント時間分布を学習することができる。
合成および実世界のデータに対する実証的な比較は、スコアリングルールをモデルトレーニングにうまく組み込むことができることを示している。
論文 参考訳(メタデータ) (2024-03-19T20:58:38Z) - Machine Learning for Soccer Match Result Prediction [0.9002260638342727]
本章では、利用可能なデータセット、モデルと機能のタイプ、モデルパフォーマンスを評価する方法について論じる。
本章の目的は,サッカーの試合結果予測のための機械学習の現状と今後の展開について概説することである。
論文 参考訳(メタデータ) (2024-03-12T14:00:50Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - Supervised Learning for Table Tennis Match Prediction [2.7835697868135902]
本稿では,テーブルテニスシングルマッチの結果を予測するために機械学習を用いることを提案する。
我々は,プレイヤーとマッチング統計を特徴として用いて,その相対的重要性をアブレーション研究で評価する。
結果は将来の卓球予測モデルのベースラインとして機能し、同様の球技の予測研究にフィードバックすることができる。
論文 参考訳(メタデータ) (2023-03-28T17:42:13Z) - Boosted Dynamic Neural Networks [53.559833501288146]
典型的なEDNNは、ネットワークバックボーンの異なる層に複数の予測ヘッドを持つ。
モデルを最適化するために、これらの予測ヘッドとネットワークバックボーンは、トレーニングデータのバッチ毎にトレーニングされる。
トレーニングと2つのフェーズでのインプットの異なるテストは、トレーニングとデータ分散のテストのミスマッチを引き起こす。
EDNNを勾配強化にインスパイアされた付加モデルとして定式化し、モデルを効果的に最適化するための複数のトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-11-30T04:23:12Z) - Explainable expected goal models for performance analysis in football
analytics [5.802346990263708]
本報告では,2014-15年と2020-21年の7シーズンから315,430発のショットをトレーニングした,欧州サッカーリーグのトップ5のゴールモデルを提案する。
我々の知る限りでは、この論文は、プロファイルを集約した説明可能な人工知能ツールの実用的な応用を実証した最初の論文である。
論文 参考訳(メタデータ) (2022-06-14T23:56:03Z) - Improved Fine-tuning by Leveraging Pre-training Data: Theory and
Practice [52.11183787786718]
対象データに事前学習されたモデルを微調整することは、多くのディープラーニングアプリケーションで広く利用されている。
近年の研究では、スクラッチからのトレーニングが、この事前トレーニング戦略に比較して、最終的なパフォーマンスを示すことが実証されている。
本稿では,対象タスクの一般化を改善するために,事前学習データからサブセットを選択する新しい選択戦略を提案する。
論文 参考訳(メタデータ) (2021-11-24T06:18:32Z) - Enhancing Trajectory Prediction using Sparse Outputs: Application to
Team Sports [6.26476800426345]
プレイヤー予測のためにディープラーニングモデルをトレーニングするのは、驚くほど難しいかもしれません。
本研究では,スパース軌道の予測と一定加速度による補間によりトレーニングを改善する新しい手法を提案する。
我々は,他の選手の完全な軌跡を条件にすることで,プレイヤーのサブセットに対する予測軌跡の精度を向上できることを見出した。
論文 参考訳(メタデータ) (2021-06-01T01:43:19Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。