論文の概要: Maximising the Set-Piece Return: Optimising Football Corner Tactics with Graph Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.06353v1
- Date: Thu, 04 Jun 2026 16:22:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.951097
- Title: Maximising the Set-Piece Return: Optimising Football Corner Tactics with Graph Reinforcement Learning
- Title(参考訳): セットピースリターンの最大化:グラフ強化学習によるフットボールコーナー戦術の最適化
- Authors: Sean Groom, Michael Groom, Francisco Belo, Axl Rice, Liam Anderson, Victor-Alexandru Darvariu, Shuo Wang,
- Abstract要約: 我々は、歴史的に観察されたパターンの模倣を越えて、新しい汎用的なプレイヤー構成と戦略を発見することを目指している。
本稿では,グラフ構造化データに基づく強化学習アーキテクチャを貢献し,プレーヤ位置の調整に関する一般的な方針を導出する。
この結果から, グラフ強化学習は, 歴史的評価や模倣から戦術的発見へと, セットピース分析をシフトさせることができることが示唆された。
- 参考スコア(独自算出の注目度): 6.110390894179624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning is increasingly employed for the evaluation of football tactics. However, existing approaches focus on characterising historical actions or analyst-specified counterfactual scenarios. In this work, we seek to go beyond the imitation of historically observed patterns towards discovering new generalisable player configurations and strategies. To tackle this, we focus on optimising corner kick routines, and formulate a decision-making problem in which a central policy makes adjustments to attacking player positions and velocities to maximise first contact shot probability. Unlike classic optimisation that solves for isolated setups, we contribute a reinforcement learning architecture operating on graph-structured data that yields a general policy for adjusting arbitrary starting player positions. Evaluated on over 3,000 Premier League corners, our approach strongly outperforms baseline optimisation techniques under matched inference budgets. Our results suggest that graph reinforcement learning can shift set-piece analysis from historical evaluation and imitation towards reward-driven tactical discovery.
- Abstract(参考訳): 機械学習はサッカーの戦術の評価にますます使われている。
しかし、既存のアプローチは、歴史的行動やアナリストが特定した反事実シナリオの特徴付けに重点を置いている。
本研究では、歴史的に観察されたパターンの模倣を越えて、新しい汎用的なプレイヤー構成と戦略の発見を目指す。
そこで我々は,コーナーキックルーチンの最適化に焦点をあて,中央方針がプレイヤーの攻撃位置や速度を調整してファーストコンタクトショット確率を最大化する決定問題を定式化する。
孤立した設定を最適化する古典的最適化とは異なり、グラフ構造化データに基づいて、任意の開始点位置を調整するための一般的なポリシーを生成する強化学習アーキテクチャに寄与する。
3000以上のプレミアリーグコーナーで評価した結果,提案手法は一致した推論予算の下で,ベースライン最適化技術よりも優れていることがわかった。
以上の結果から,グラフ強化学習は,過去の評価と模倣から,報酬駆動型戦術発見へとセットピース分析を移行できる可能性が示唆された。
関連論文リスト
- Evolution of Optimization Methods: Algorithms, Scenarios, and Evaluations [98.44542103979735]
勾配勾配降下法(SGD)とアダム(Adam)による1次勾配勾配降下法は、現代の訓練パイプラインの基礎となる。
大規模モデルトレーニング、厳格なプライバシ要件、分散学習パラダイムは、プライバシ保護とメモリ効率に関する従来のアプローチにおける重要な制限を明らかにする。
深層学習最適化アルゴリズムの進化軌道を振り返って分析し、様々なモデルアーキテクチャやトレーニングシナリオの主流を包括的に評価する。
我々は、重要な新興トレンドと基本設計のトレードオフを抽出し、将来の研究の有望な方向性を示唆する。
論文 参考訳(メタデータ) (2026-04-14T17:01:36Z) - GenTac: Generative Modeling and Forecasting of Soccer Tactics [66.35532694378146]
GenTacはサッカーの戦術を、連続したマルチプレイヤーの軌跡と個別の意味的な出来事のプロセスとして概念化している。
対戦行動、特定のチームやリーグプレースタイル、戦略的目的など、リッチなコンテキスト条件付けをサポートする。
バスケットボール、アメリカンフットボール、アイスホッケーなど、他のダイナミックチームスポーツへの一般化をうまく訓練することができる。
論文 参考訳(メタデータ) (2026-04-13T17:53:49Z) - Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense [51.736723807086385]
本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。
本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。
エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。
我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
論文 参考訳(メタデータ) (2025-08-01T13:55:39Z) - Landscape-Aware Growing: The Power of a Little LAG [49.897766925371485]
成長戦略のプールから最適な成長戦略をどのように選択するかという課題について検討する。
ランドスケープ・アウェア・グロース(LAG)と呼ぶ早期学習力学に基づく代替視点を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:38:57Z) - Advanced Volleyball Stats for All Levels: Automatic Setting Tactic
Detection and Classification with a Single Camera [15.032833555418314]
バレーボールの試合における戦略分類の設定に特化して設計された2つの新しいエンドツーエンドコンピュータビジョンフレームワークを提案する。
本フレームワークは,ボール軌跡認識と新しいセット軌跡分類器を組み合わせることで,包括的・高度な統計データを生成する。
本システムでは,実時間展開が可能であり,ゲーム内戦略分析やスポット内ゲームプランの調整が可能である。
論文 参考訳(メタデータ) (2023-09-26T08:29:02Z) - Massively Scalable Inverse Reinforcement Learning in Google Maps [3.1244966374281544]
逆強化学習は、ルートレコメンデーションにおいて人間の潜在的嗜好を学習するための強力で一般的な枠組みを提供する。
数億の州と実証軌道で惑星規模の問題に対処したアプローチはない。
我々は、ルーティングコンテキストにおける古典的IRL手法を再検討し、安価で決定論的プランナーと高価で堅牢なポリシーとの間にトレードオフがあることを重要視する。
Receding Horizon Inverse Planning (RHIP)は、従来のIRLアルゴリズムの新たな一般化であり、その計画的地平を通したパフォーマンストレードオフのきめ細かい制御を提供する。
論文 参考訳(メタデータ) (2023-05-18T20:14:28Z) - Projective Ranking-based GNN Evasion Attacks [52.85890533994233]
グラフニューラルネットワーク(GNN)は、グラフ関連のタスクに対して、有望な学習方法を提供する。
GNNは敵の攻撃の危険にさらされている。
論文 参考訳(メタデータ) (2022-02-25T21:52:09Z) - Decaying Clipping Range in Proximal Policy Optimization [0.0]
PPO(Proximal Policy Optimization)は、強化学習で最も広く使用されているアルゴリズムの1つです。
その成功の鍵は、クリッピングメカニズムによる信頼できるポリシー更新と、ミニバッチ更新の複数のエポックである。
トレーニング全体を通して線形および指数関数的に減衰するクリッピング範囲のアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-20T22:08:05Z) - Inverse Reinforcement Learning from a Gradient-based Learner [41.8663538249537]
逆強化学習は、専門家の報酬関数をデモンストレーションから推測する問題に対処する。
本稿では,エージェントが最適化した報酬関数を復元するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-15T16:41:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。