論文の概要: Towards optimized actions in critical situations of soccer games with
deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2109.06625v1
- Date: Tue, 14 Sep 2021 12:27:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 23:02:14.826672
- Title: Towards optimized actions in critical situations of soccer games with
deep reinforcement learning
- Title(参考訳): 深層強化学習によるサッカーの批判的状況におけるアクションの最適化に向けて
- Authors: Pegah Rahimian and Afshin Oroojlooy and Laszlo Toka
- Abstract要約: 本研究は,サッカーゲームにおける新しい状態表現と,スマートポリシーネットワークをトレーニングするためのバッチ強化学習を提案する。
InStatによる104試合のサッカーログの数値実験を行った。
その結果,全104ゲームにおいて,最適化されたポリシーは行動ポリシーよりも高い報酬を得ることがわかった。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Soccer is a sparse rewarding game: any smart or careless action in critical
situations can change the result of the match. Therefore players, coaches, and
scouts are all curious about the best action to be performed in critical
situations, such as the times with a high probability of losing ball possession
or scoring a goal. This work proposes a new state representation for the soccer
game and a batch reinforcement learning to train a smart policy network. This
network gets the contextual information of the situation and proposes the
optimal action to maximize the expected goal for the team. We performed
extensive numerical experiments on the soccer logs made by InStat for 104
European soccer matches. The results show that in all 104 games, the optimized
policy obtains higher rewards than its counterpart in the behavior policy.
Besides, our framework learns policies that are close to the expected behavior
in the real world. For instance, in the optimized policy, we observe that some
actions such as foul, or ball out can be sometimes more rewarding than a shot
in specific situations.
- Abstract(参考訳): サッカーはささやかな報酬ゲームであり、重要な状況においてスマートで不注意なアクションは試合の結果を変えることができる。
そのため、選手、コーチ、スカウトは皆、ボールの所有を失ったりゴールを決めたりする確率の高い時間など、重要な状況で実行すべき最善の行動に興味を持っている。
本研究は,サッカーゲームにおける新しい状態表現と,スマートポリシーネットワークをトレーニングするためのバッチ強化学習を提案する。
このネットワークは状況のコンテキスト情報を取得し、チームが期待するゴールを最大化するための最適な行動を提案する。
欧州サッカー104試合において,instatによるサッカーログの数値実験を行った。
その結果,全104ゲームにおいて,最適化されたポリシーは行動ポリシーよりも高い報酬を得ることがわかった。
さらに,我々のフレームワークは,現実世界で期待される行動に近い政策を学習する。
例えば、最適化されたポリシーでは、特定の状況ではショットよりもファウルやボールアウトのようなアクションの方が報酬になることがある。
関連論文リスト
- Engineering Features to Improve Pass Prediction in Soccer Simulation 2D
Games [0.0]
サッカーシミュレーション2D(英: Soccer Simulation 2D)は、2次元の実際のサッカーゲームのシミュレーションである。
我々は,Deep Neural Networks (DNN) とRandom Forest (RF) を用いたサッカー2Dプレーヤーのパス動作のモデル化を試みた。
RoboCup 2019の6つのトップチームに対して、トレーニングされたモデルのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2024-01-07T08:01:25Z) - All by Myself: Learning Individualized Competitive Behaviour with a
Contrastive Reinforcement Learning optimization [57.615269148301515]
競争ゲームのシナリオでは、エージェントのセットは、彼らの目標を最大化し、敵の目標を同時に最小化する決定を学習する必要があります。
本稿では,競争ゲームの表現を学習し,特定の相手の戦略をどうマップするか,それらを破壊するかを学習する3つのニューラルネットワーク層からなる新しいモデルを提案する。
我々の実験は、オフライン、オンライン、競争特化モデル、特に同じ対戦相手と複数回対戦した場合に、我々のモデルがより良いパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-10-02T08:11:07Z) - Action valuation of on- and off-ball soccer players based on multi-agent
deep reinforcement learning [4.477124009148237]
マルチエージェント深部強化学習に基づく1つの総合的な枠組みを用いて,オンタイムおよびオフボール選手のアクションを評価する手法を提案する。
本手法では,識別やラベル付けが困難なゲームを通して,複数のプレイヤーが連続的に動き続けるかを評価することができる。
論文 参考訳(メタデータ) (2023-05-29T05:14:36Z) - ApproxED: Approximate exploitability descent via learned best responses [61.17702187957206]
連続的なアクションセットを持つゲームの近似的ナッシュ均衡を求める問題について検討する。
本稿では,戦略プロファイルに対するエクスプロイラビリティの近似を最小化する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-01-20T23:55:30Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Basis for Intentions: Efficient Inverse Reinforcement Learning using
Past Experience [89.30876995059168]
逆強化学習(IRL) - エージェントの報酬関数をその振る舞いを観察することから推測する。
本稿では、エージェントの報酬関数を観察することのできないIRLの問題に対処する。
論文 参考訳(メタデータ) (2022-08-09T17:29:49Z) - Leaving Goals on the Pitch: Evaluating Decision Making in Soccer [21.85419069962932]
機械学習と人工知能(AI)の技術を組み合わせてサッカーにおける意思決定を推論する汎用フレームワークを提案する。
私たちの重要な結論は、チームが少数のチーム固有の場所でペナルティボックスの外からより頻繁にショットした場合、より多くの目標を達成できるということです。
論文 参考訳(メタデータ) (2021-04-07T16:56:31Z) - An analysis of Reinforcement Learning applied to Coach task in IEEE Very
Small Size Soccer [2.5400028272658144]
本稿では、強化学習(RL)に基づくコーチングタスクのエンドツーエンドアプローチを提案する。
シミュレーション環境では、3つの異なるチームに対して2つのRLポリシーをトレーニングしました。
結果はVSSSリーグのトップチームの1つに対して評価された。
論文 参考訳(メタデータ) (2020-11-23T23:10:06Z) - Game Plan: What AI can do for Football, and What Football can do for AI [83.79507996785838]
予測的および規範的フットボール分析は、統計学習、ゲーム理論、コンピュータビジョンの交差点における新たな発展と進歩を必要とする。
フットボール分析は、サッカー自体のゲームを変えるだけでなく、この領域がAIの分野で何を意味するのかという観点からも、非常に価値の高いゲームチェンジャーであることを示す。
論文 参考訳(メタデータ) (2020-11-18T10:26:02Z) - Optimising Game Tactics for Football [18.135001427294032]
サッカーにおける戦術的・戦略的意思決定を最適化するための新しいアプローチを提案する。
我々は,サッカーをベイズゲームから構成したマルチステージゲームとしてモデル化し,プレマッチ決定をモデル化し,インマッチ状態遷移と決定をモデル化する。
これに基づいて、異なる目的でチーム形成とゲーム内戦術を最適化するアルゴリズムを開発する。
論文 参考訳(メタデータ) (2020-03-23T14:24:45Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。