論文の概要: Action Anticipation from SoccerNet Football Video Broadcasts
- arxiv url: http://arxiv.org/abs/2504.12021v1
- Date: Wed, 16 Apr 2025 12:24:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:39:29.284996
- Title: Action Anticipation from SoccerNet Football Video Broadcasts
- Title(参考訳): サッカーネットフットボール映像放送からの行動予測
- Authors: Mohamad Dalal, Artur Xarles, Anthony Cioppa, Silvio Giancola, Marc Van Droogenbroeck, Bernard Ghanem, Albert Clapés, Sergio Escalera, Thomas B. Moeslund,
- Abstract要約: フットボール放送ビデオのアクション予測タスクについて紹介する。
我々は、5秒または10秒の予測ウィンドウ内で、観測されていない将来のフレームにおける将来の動作を予測する。
我々の研究は、自動放送、戦術分析、プレイヤーの意思決定における応用を可能にします。
- 参考スコア(独自算出の注目度): 84.87912817065506
- License:
- Abstract: Artificial intelligence has revolutionized the way we analyze sports videos, whether to understand the actions of games in long untrimmed videos or to anticipate the player's motion in future frames. Despite these efforts, little attention has been given to anticipating game actions before they occur. In this work, we introduce the task of action anticipation for football broadcast videos, which consists in predicting future actions in unobserved future frames, within a five- or ten-second anticipation window. To benchmark this task, we release a new dataset, namely the SoccerNet Ball Action Anticipation dataset, based on SoccerNet Ball Action Spotting. Additionally, we propose a Football Action ANticipation TRAnsformer (FAANTRA), a baseline method that adapts FUTR, a state-of-the-art action anticipation model, to predict ball-related actions. To evaluate action anticipation, we introduce new metrics, including mAP@$\delta$, which evaluates the temporal precision of predicted future actions, as well as mAP@$\infty$, which evaluates their occurrence within the anticipation window. We also conduct extensive ablation studies to examine the impact of various task settings, input configurations, and model architectures. Experimental results highlight both the feasibility and challenges of action anticipation in football videos, providing valuable insights into the design of predictive models for sports analytics. By forecasting actions before they unfold, our work will enable applications in automated broadcasting, tactical analysis, and player decision-making. Our dataset and code are publicly available at https://github.com/MohamadDalal/FAANTRA.
- Abstract(参考訳): 人工知能(AI)は、スポーツビデオの分析方法に革命をもたらした。
これらの努力にもかかわらず、ゲームアクションが起こる前にゲームアクションを予測することにはほとんど注意が払われていない。
本研究では,5秒ないし10秒の予測ウィンドウ内で,観測されていない将来のフレームにおける将来のアクションを予測することを目的とした,フットボール放送ビデオのアクション予測タスクを紹介する。
このタスクをベンチマークするために、新しいデータセット、すなわち SoccerNet Ball Action Spotting に基づいた SoccerNet Ball Action Precipation データセットをリリースする。
さらに,現在最先端のアクション予測モデルであるFUTRをベースラインとして,ボール関連アクションの予測を行うFAANTRAを提案する。
行動予測を評価するために、予測される将来の行動の時間的精度を評価するmAP@$\delta$や、予測ウィンドウ内で発生を評価するmAP@$\infty$など、新しい指標を導入する。
また、様々なタスク設定、入力設定、モデルアーキテクチャの影響を調べるために、広範囲にわたるアブレーション研究を行っている。
実験結果はフットボールビデオにおけるアクション予測の実現可能性と課題の両方を強調し、スポーツ分析のための予測モデルの設計に関する貴重な洞察を提供する。
展開前にアクションを予測することで、自動放送、戦術分析、プレイヤーの意思決定に応用することが可能になります。
私たちのデータセットとコードはhttps://github.com/MohamadDalal/FAANTRAで公開されています。
関連論文リスト
- Pose2Trajectory: Using Transformers on Body Pose to Predict Tennis Player's Trajectory [6.349503549199403]
テニス選手の身体関節データとボール位置から導かれるシーケンスとして,選手の将来の軌跡を予測するPose2Trajectoryを提案する。
我々は,ボール位置を持つ選手の関節および軌道情報に基づいて訓練されたエンコーダ・デコーダ変換器アーキテクチャを用いる。
複数のビデオから高品質なデータセットを生成し、物体検出と人間のポーズ推定手法を用いてテニス選手の動き予測を支援する。
論文 参考訳(メタデータ) (2024-11-07T07:50:58Z) - Deep learning for action spotting in association football videos [64.10841325879996]
SoccerNetイニシアチブは毎年の課題を組織し、世界中の参加者が最先端のパフォーマンスを達成するために競う。
本稿では,スポーツにおけるアクションスポッティングの歴史を,2018年の課題の創出から,現在の研究・スポーツ産業における役割まで遡る。
論文 参考訳(メタデータ) (2024-10-02T07:56:15Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - Rethinking Learning Approaches for Long-Term Action Anticipation [32.67768331823358]
アクション予測は、ビデオの初期部分を観察した将来のアクションを予測することを含む。
本稿では,長期的行動予測を行う抗CIPATRについて紹介する。
本稿では,新しいトランスモデルを構築するための2段階学習手法を提案する。
論文 参考訳(メタデータ) (2022-10-20T20:07:30Z) - Untrimmed Action Anticipation [20.630139085937586]
エゴセントリックなアクション予測は、カメラ装着者がエゴセントリックなビデオから将来のアクションを予測することである。
現在のアプローチでは、入力ビデオはトリミングされていると仮定しており、短いビデオシーケンスはアクションの開始前に一定時間サンプリングされる。
この分野の最近の進歩にもかかわらず、トリムされた行動予測は現実のシナリオにおいて限定的な適用性を有すると我々は主張する。
論文 参考訳(メタデータ) (2022-02-08T20:20:08Z) - Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts [86.56462654572813]
私たちは、サッカーの試合の主なアクションを一時的にローカライズするサッカー放送におけるアクションスポッティングの分析に焦点を当てています。
時間的知識を組み込んだNetVLAD++という,NetVLADに基づく新たな機能プーリング手法を提案する。
我々は最近の大規模データセット SoccerNet-v2 の方法論をトレーニングし、評価し、アクションスポッティングのための平均平均mAP 53.4% に達した。
論文 参考訳(メタデータ) (2021-04-14T11:09:03Z) - Learning to Anticipate Egocentric Actions by Imagination [60.21323541219304]
我々は,エゴセントリックなアクション予測タスクについて検討し,エゴセントリックなビデオの再生に先立って,将来のアクション秒を予測する。
本手法は, EPIC Kitchens Action Precipation Challenge の既視テストセットと未確認テストセットの両方において, 従来手法を有意に上回った。
論文 参考訳(メタデータ) (2021-01-13T08:04:10Z) - Interpretable Real-Time Win Prediction for Honor of Kings, a Popular
Mobile MOBA Esport [51.20042288437171]
本研究では,2段階空間時間ネットワーク(TSSTN)を提案する。
実世界のライブストリーミングシナリオにおける実験結果と応用により,提案したTSSTNモデルは予測精度と解釈可能性の両方において有効であることが示された。
論文 参考訳(メタデータ) (2020-08-14T12:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。