論文の概要: Puck localization and multi-task event recognition in broadcast hockey
videos
- arxiv url: http://arxiv.org/abs/2105.10563v1
- Date: Fri, 21 May 2021 20:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 12:28:21.236395
- Title: Puck localization and multi-task event recognition in broadcast hockey
videos
- Title(参考訳): 放送ホッケービデオにおけるパックローカライゼーションとマルチタスクイベント認識
- Authors: Kanav Vats, Mehrnaz Fani, David A. Clausi, John Zelek
- Abstract要約: パックのローカライゼーションは、アイスホッケービデオ分析においてゲーム分析に有用な重要な問題である。
ブロードキャストホッケービデオにおけるパックローカライズのためのネットワークを導入し実装する。
- 参考スコア(独自算出の注目度): 9.316018917078049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Puck localization is an important problem in ice hockey video analytics
useful for analyzing the game, determining play location, and assessing puck
possession. The problem is challenging due to the small size of the puck,
excessive motion blur due to high puck velocity and occlusions due to players
and boards. In this paper, we introduce and implement a network for puck
localization in broadcast hockey video. The network leverages expert NHL
play-by-play annotations and uses temporal context to locate the puck. Player
locations are incorporated into the network through an attention mechanism by
encoding player positions with a Gaussian-based spatial heatmap drawn at player
positions. Since event occurrence on the rink and puck location are related, we
also perform event recognition by augmenting the puck localization network with
an event recognition head and training the network through multi-task learning.
Experimental results demonstrate that the network is able to localize the puck
with an AUC of $73.1 \%$ on the test set. The puck location can be inferred in
720p broadcast videos at $5$ frames per second. It is also demonstrated that
multi-task learning with puck location improves event recognition accuracy.
- Abstract(参考訳): パックのローカライズは、アイスホッケービデオ分析において重要な問題であり、ゲームの解析、プレイ位置の決定、パックの所有度の評価に有用である。
問題はパックが小さいこと、パックの速度が高いことによる過度な動きのぼやけ、プレイヤーやボードによる閉塞のためである。
本稿では,放送ホッケービデオにおけるパックローカライズのためのネットワークについて紹介し,実装する。
このネットワークは専門家のNHLプレイバイプレイアノテーションを活用し、時間的コンテキストを使ってパックを見つける。
プレイヤー位置をガウス系空間熱マップで符号化することにより、アテンション機構を介してプレイヤー位置をネットワークに組み込む。
リンクやパック位置でのイベント発生は関連しているため、イベント認識ヘッドでパックの局所化ネットワークを強化し、マルチタスク学習を通じてネットワークをトレーニングすることで、イベント認識を行う。
実験の結果、ネットワークはテストセット上で73.1セントのaucでパックをローカライズできることが示されている。
puckのロケーションは、720pのブロードキャストビデオで毎秒5ドルのフレームで推測できる。
また,puckロケーションを用いたマルチタスク学習により,イベント認識精度が向上することを示す。
関連論文リスト
- GoalieNet: A Multi-Stage Network for Joint Goalie, Equipment, and Net
Pose Estimation in Ice Hockey [82.74877848011798]
GoalieNetは多段階のディープニューラルネットワークで、ゴールキーパーのポーズ、機器、ネットを共同で推定する。
NHLベンチマークデータを用いた実験の結果、提案したGoalieNetは、すべてのキーポイントで平均84%の精度を達成可能であることが示された。
論文 参考訳(メタデータ) (2023-06-28T01:00:36Z) - GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for
Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。
私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文 参考訳(メタデータ) (2023-03-26T08:43:36Z) - $\textbf{P$^2$A}$: A Dataset and Benchmark for Dense Action Detection
from Table Tennis Match Broadcasting Videos [54.71836328275178]
スポーツビデオデータセット $textbfP$2$A$ for $underlineP$ong-$underlineA$ction detection もリリースしています。
このデータセットはプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
論文 参考訳(メタデータ) (2022-07-26T08:34:17Z) - Evaluating deep tracking models for player tracking in broadcast ice
hockey video [20.850267622473176]
選手追跡は、ホッケー選手の動きが高速で非線形であるため、難しい問題である。
我々は、いくつかの最先端追跡アルゴリズムを比較し、アイスホッケーのパフォーマンスと失敗モードを分析した。
論文 参考訳(メタデータ) (2022-05-22T22:56:31Z) - Ice hockey player identification via transformers [11.28395713457468]
そこで我々は,NHL(National Hockey League)ビデオで選手のジャージー番号を識別するトランスフォーマーネットワークを導入する。
提案するネットワークは、使用したデータセットの以前のベンチマークよりもパフォーマンスがよい。
また,光学式文字認識(OCR)を用いてゲーム時間を読み取ることで,NHLプレイバイプレイデータで利用可能なプレイヤーシフトを利用して,特定のゲーム時間でプレイヤーをアイスリンクに誘導する。
論文 参考訳(メタデータ) (2021-11-22T21:10:26Z) - Player Tracking and Identification in Ice Hockey [9.577770317771087]
本稿では,NHLホッケー映像の選手の追跡と識別を行う自動システムを提案する。
本システムは,(1)選手追跡,(2)チーム識別,(3)プレイヤー識別の3つのコンポーネントから構成される。
チーム識別では、アウトチームジャージは単一のクラスにグループ化され、ホームチームジャージはそのジャージの色に応じてクラスにグループ化される。
時間的一次元畳み込みネットワークを利用してプレイヤー境界ボックス列からプレイヤーを識別する新しいプレイヤー識別モデルを提案する。
論文 参考訳(メタデータ) (2021-10-06T22:37:08Z) - Localization of Ice-Rink for Broadcast Hockey Videos [75.9924857328797]
放送ビデオからのホッケーアイスリンクローカライズのためのフレームワークを紹介する。
ResNet18ベースの回帰器が実装され、訓練され、フレーム単位でモデル上の4つの制御ポイントに回帰する。
滑らかなホモグラフィ行列は、対応する4つの点の対の直線型変換を用いて計算される。
論文 参考訳(メタデータ) (2021-04-22T03:39:43Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z) - Player Identification in Hockey Broadcast Videos [18.616544581429835]
我々はNHL放送におけるホッケー選手識別の問題を解決するために,深層畳み込みニューラルネットワークアプローチを提案する。
本稿では,ResNet+LSTMネットワークの出力を分類するために,2次1次元畳み込みニューラルネットワークをレイトスコアレベル融合法として利用する。
これにより、新しいデータセットのテスト分割で、全体的なプレイヤー識別精度が87%以上になる。
論文 参考訳(メタデータ) (2020-09-05T01:30:15Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z) - Beyond the Camera: Neural Networks in World Coordinates [82.31045377469584]
眼球運動は、動物にシーンの解像度を高め、邪魔な情報を抑制する。
そこで我々は,各層における各機能が空間変換を持ち,機能マップは必要に応じてのみ変換される,シンプルなアイデア WorldFeatures を提案する。
これらのWorldFeaturesで構築されたネットワークは、事前に記録されたビデオのバッチ設定であっても、ササード、固定、スムーズな追跡などの眼球運動をモデル化することができる。
論文 参考訳(メタデータ) (2020-03-12T04:29:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。