論文の概要: Predicting Penalty Kick Direction Using Multi-Modal Deep Learning with Pose-Guided Attention
- arxiv url: http://arxiv.org/abs/2509.26088v1
- Date: Tue, 30 Sep 2025 11:02:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.11044
- Title: Predicting Penalty Kick Direction Using Multi-Modal Deep Learning with Pose-Guided Attention
- Title(参考訳): Pose-Guided Attention を用いた多モード深層学習によるペナルティキック方向の予測
- Authors: Pasindu Ranasinghe, Pamudu Ranasinghe,
- Abstract要約: 本研究では,ボール接触前のペナルティキックの方向を予測するためのリアルタイム・マルチモーダル深層学習フレームワークを提案する。
755ペナルティキックイベントのカスタムデータセットは、実際のマッチビデオから作成され、オブジェクト検出、シューターキーポイント、ファイナルボール配置のためのフレームレベルのアノテーションが提供されている。
このモデルはホールドアウトテストセットで89%の精度を達成し、視覚のみのベースラインとポーズのみのベースラインを14-22%上回った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Penalty kicks often decide championships, yet goalkeepers must anticipate the kicker's intent from subtle biomechanical cues within a very short time window. This study introduces a real-time, multi-modal deep learning framework to predict the direction of a penalty kick (left, middle, or right) before ball contact. The model uses a dual-branch architecture: a MobileNetV2-based CNN extracts spatial features from RGB frames, while 2D keypoints are processed by an LSTM network with attention mechanisms. Pose-derived keypoints further guide visual focus toward task-relevant regions. A distance-based thresholding method segments input sequences immediately before ball contact, ensuring consistent input across diverse footage. A custom dataset of 755 penalty kick events was created from real match videos, with frame-level annotations for object detection, shooter keypoints, and final ball placement. The model achieved 89% accuracy on a held-out test set, outperforming visual-only and pose-only baselines by 14-22%. With an inference time of 22 milliseconds, the lightweight and interpretable design makes it suitable for goalkeeper training, tactical analysis, and real-time game analytics.
- Abstract(参考訳): ペナルティキックはしばしばチャンピオンシップを決定するが、ゴールキーパーは、非常に短い時間内に微妙なバイオメカニカル・キューから、キッカーの意図を予測しなければならない。
本研究では,ボール接触前のペナルティキック(左,中,右)の方向を予測するためのリアルタイム・マルチモーダルディープラーニングフレームワークを提案する。
MobileNetV2ベースのCNNはRGBフレームから空間的特徴を抽出し、2Dキーポイントは注意機構を備えたLSTMネットワークで処理する。
詩由来のキーポイントは、タスク関連領域への視覚的焦点をさらに導く。
距離ベースしきい値設定法は、ボール接触直前に入力シーケンスをセグメントし、多様な映像間で一貫した入力を確保する。
755ペナルティキックイベントのカスタムデータセットは、実際のマッチビデオから作成され、オブジェクト検出、シューターキーポイント、ファイナルボール配置のためのフレームレベルのアノテーションが提供されている。
このモデルはホールドアウトテストセットで89%の精度を達成し、視覚のみのベースラインとポーズのみのベースラインを14-22%上回った。
推定時間は22ミリ秒で、軽量で解釈可能な設計により、ゴールキーパーのトレーニング、戦術分析、リアルタイムゲーム分析に適している。
関連論文リスト
- Action Anticipation from SoccerNet Football Video Broadcasts [84.87912817065506]
フットボール放送ビデオのアクション予測タスクについて紹介する。
我々は、5秒または10秒の予測ウィンドウ内で、観測されていない将来のフレームにおける将来の動作を予測する。
我々の研究は、自動放送、戦術分析、プレイヤーの意思決定における応用を可能にします。
論文 参考訳(メタデータ) (2025-04-16T12:24:33Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - Classifying Soccer Ball-on-Goal Position Through Kicker Shooting Action [1.3887779684720984]
本研究は、シューターの蹴りを観察することで、サッカーフリーキック後のボールの方向を正確に予測できるかどうかを論じる。
我々のアプローチは、ヒューマンアクション認識(HAR)埋め込みとコンテキスト情報を統合するモデルを開発するためにニューラルネットワークを活用することである。
その結果,2つの主要なBoGPクラス(左右)を考える場合,69.1%の精度が得られた。
論文 参考訳(メタデータ) (2023-12-23T12:11:38Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Predicting the outcome of team movements -- Player time series analysis
using fuzzy and deep methods for representation learning [0.0]
我々は、より拡張された一連の動きや戦術計画において、短い戦術と宇宙占領の有用なエンコーディングのためのフレームワークを提供する。
本稿では,2015-16シーズンのプロバスケットボールSportVUデータセットにおける予測・認識タスクに対する提案手法の有効性について検討する。
論文 参考訳(メタデータ) (2021-09-13T18:42:37Z) - Unsupervised Visual Representation Learning by Tracking Patches in Video [88.56860674483752]
本研究では,コンピュータビジョンシステムのプロキシタスクとしてトラッキングを用いて視覚表現を学習することを提案する。
子どもたちがプレイするキャッチゲームをベースに、視覚表現を学ぶ3D-CNNモデルのためのキャッチ・ザ・パッチ(CtP)ゲームを設計します。
論文 参考訳(メタデータ) (2021-05-06T09:46:42Z) - TTNet: Real-time temporal and spatial video analysis of table tennis [5.156484100374058]
本稿では,高精細度卓球ビデオのリアルタイム処理を目的としたニューラルネットワークを提案する。
このアプローチは、自動参照システムによるスコア更新を推論するためのコア情報を提供する。
イベントをラベル付けした120fpsのテーブルテニスゲームのビデオ付きマルチタスクデータセットOpenTTGamesを公開している。
論文 参考訳(メタデータ) (2020-04-21T11:57:51Z) - Unsupervised Temporal Feature Aggregation for Event Detection in
Unstructured Sports Videos [10.230408415438966]
任意のカメラアングルを持つ非構造化環境を対象としたスポーツビデオにおけるイベント検出事例について検討した。
我々は、非構造化設定におけるプレイヤーの教師なし識別と、任意の射撃角度によるバリエーションを示すために訓練されたモデルの一般化の2つの主要な問題を同定し、解決する。
論文 参考訳(メタデータ) (2020-02-19T10:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。