論文の概要: Jersey Number Recognition using Keyframe Identification from
Low-Resolution Broadcast Videos
- arxiv url: http://arxiv.org/abs/2309.06285v1
- Date: Tue, 12 Sep 2023 14:43:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 12:31:56.950273
- Title: Jersey Number Recognition using Keyframe Identification from
Low-Resolution Broadcast Videos
- Title(参考訳): 低解像度放送映像からのキーフレーム識別を用いたジャージー番号認識
- Authors: Bavesh Balaji, Jerrin Bright, Harish Prakash, Yuhao Chen, David A
Clausi and John Zelek
- Abstract要約: プレイヤー識別は、プレイヤーアセスメント、ゲーム内分析、放送アセスメントなどの様々なタスクを可能にする、ビジョン駆動型サッカー分析において重要な要素である。
以前の手法では画像データでは成功したが、ほとんどのフレームではジャージ番号が見えない実世界のビデオデータに苦戦している。
本稿では,ジャージ数に関する重要な高レベル情報を含むフレームを抽出する,ロバストな下流識別モジュールを提案する。
- 参考スコア(独自算出の注目度): 7.776923607006088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Player identification is a crucial component in vision-driven soccer
analytics, enabling various downstream tasks such as player assessment, in-game
analysis, and broadcast production. However, automatically detecting jersey
numbers from player tracklets in videos presents challenges due to motion blur,
low resolution, distortions, and occlusions. Existing methods, utilizing
Spatial Transformer Networks, CNNs, and Vision Transformers, have shown success
in image data but struggle with real-world video data, where jersey numbers are
not visible in most of the frames. Hence, identifying frames that contain the
jersey number is a key sub-problem to tackle. To address these issues, we
propose a robust keyframe identification module that extracts frames containing
essential high-level information about the jersey number. A spatio-temporal
network is then employed to model spatial and temporal context and predict the
probabilities of jersey numbers in the video. Additionally, we adopt a
multi-task loss function to predict the probability distribution of each digit
separately. Extensive evaluations on the SoccerNet dataset demonstrate that
incorporating our proposed keyframe identification module results in a
significant 37.81% and 37.70% increase in the accuracies of 2 different test
sets with domain gaps. These results highlight the effectiveness and importance
of our approach in tackling the challenges of automatic jersey number detection
in sports videos.
- Abstract(参考訳): プレイヤー識別は、視覚駆動サッカー分析において重要な要素であり、プレイヤー評価、ゲーム内分析、ブロードキャスト生産など、様々な下流タスクを可能にする。
しかし、ビデオ中のプレーヤーのトラックレットからジャージ番号を自動的に検出すると、動きのぼやけ、低解像度、歪み、閉塞などの問題が発生する。
空間変換器ネットワーク、CNN、ビジョン変換器を利用する既存の手法は、画像データに成功しているが、ほとんどのフレームでジャージ番号が見えない実世界のビデオデータに苦戦している。
したがって、ジャージ番号を含むフレームの識別は、取り組むべき重要な副問題である。
これらの問題に対処するために,ジャージー番号に関する重要なハイレベル情報を含むフレームを抽出するロバストなキーフレーム識別モジュールを提案する。
次に時空間ネットワークを用いて、空間的・時間的文脈をモデル化し、ビデオ内のジャージ番号の確率を予測する。
さらに、各桁の確率分布を別々に予測するために、マルチタスク損失関数を採用する。
soccernetデータセットの広範な評価は、提案するキーフレーム識別モジュールを組み込むことで、ドメインギャップを持つ2つの異なるテストセットの精度が37.81%と37.70%向上することを示している。
これらの結果は,スポーツビデオにおける自動ジャージ数検出の課題に対処するためのアプローチの有効性と重要性を強調した。
関連論文リスト
- A General Framework for Jersey Number Recognition in Sports Video [5.985204759362746]
ジャージーの数字認識はスポーツビデオ解析において重要な課題であり、その理由の一部は長期の選手追跡において重要であるためである。
本稿では,ホッケーのための新しいパブリックジャージ番号認識データセットを紹介し,この問題に対してシーンテキスト認識手法をどのように適用できるかを考察する。
我々は,イメージレベルのタスクとトラックレットレベルのタスクで高いパフォーマンスを示し,ホッケーのイメージでは91.4%,サッカーのトラックレットでは87.4%の精度を達成した。
論文 参考訳(メタデータ) (2024-05-22T18:08:26Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Anomaly Detection in Aerial Videos with Transformers [49.011385492802674]
我々は、空中ビデオの異常検出のための新しいデータセットDroneAnomalyを作成します。
87,488色のビデオフレーム(トレーニング用51,635フレーム、テスト用35,853フレーム)があり、サイズは640×640ドル/秒である。
本稿では,連続するビデオフレームを一連のチューブレットとして扱う新しいベースラインモデルAnomaly Detection with Transformers (ANDT)を提案する。
論文 参考訳(メタデータ) (2022-09-25T21:24:18Z) - Automated player identification and indexing using two-stage deep
learning network [0.23610495849936355]
本稿では,アメリカンフットボールの試合における選手の参加を自動的に追跡し,その参加度を指標とする深層学習型選手追跡システムを提案する。
関心領域をハイライトし、ジャージ番号情報を高精度に識別するための2段階ネットワーク設計である。
フットボールビデオの質的,定量的な結果を分析することにより,選手追跡システムの有効性と信頼性を実証する。
論文 参考訳(メタデータ) (2022-04-26T02:59:03Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Knock, knock. Who's there? -- Identifying football player jersey numbers
with synthetic data [0.0]
シアトル・シーホークスの練習ビデオから得られた,小型で不均衡なデータセットにおいて,ジャージ番号識別のための新しい手法を提案する。
以上の結果から, 単純なモデルではジャージ数検出タスクで許容性能が得られ, 合成データにより性能が劇的に向上することが示唆された。
論文 参考訳(メタデータ) (2022-03-01T20:44:34Z) - HighlightMe: Detecting Highlights from Human-Centric Videos [52.84233165201391]
我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。
本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。
我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4~12%向上したことを観察した。
論文 参考訳(メタデータ) (2021-10-05T01:18:15Z) - Player Identification in Hockey Broadcast Videos [18.616544581429835]
我々はNHL放送におけるホッケー選手識別の問題を解決するために,深層畳み込みニューラルネットワークアプローチを提案する。
本稿では,ResNet+LSTMネットワークの出力を分類するために,2次1次元畳み込みニューラルネットワークをレイトスコアレベル融合法として利用する。
これにより、新しいデータセットのテスト分割で、全体的なプレイヤー識別精度が87%以上になる。
論文 参考訳(メタデータ) (2020-09-05T01:30:15Z) - Dense-Caption Matching and Frame-Selection Gating for Temporal
Localization in VideoQA [96.10612095576333]
本稿では,マルチモーダルな入力源を効果的に統合し,時間的関連情報から質問に答えるビデオ質問応答モデルを提案する。
また,2レベルアテンション(単語・オブジェクト・フレームレベル),異なるソース(ビデオ・高密度キャプション)に対するマルチヘッド自己統合,ゲートへのより関連性の高い情報伝達などで構成されている。
当社のモデルは,各モデルコンポーネントが大きな利益をもたらす,難易度の高いTVQAデータセット上で評価され,全体的なモデルでは,最先端のモデルよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-05-13T16:35:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。