論文の概要: A General Framework for Jersey Number Recognition in Sports Video
- arxiv url: http://arxiv.org/abs/2405.13896v1
- Date: Wed, 22 May 2024 18:08:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-24 20:43:22.449673
- Title: A General Framework for Jersey Number Recognition in Sports Video
- Title(参考訳): スポーツビデオにおけるジャージー数認識のための一般的な枠組み
- Authors: Maria Koshkina, James H. Elder,
- Abstract要約: ジャージーの数字認識はスポーツビデオ解析において重要な課題であり、その理由の一部は長期の選手追跡において重要であるためである。
本稿では,ホッケーのための新しいパブリックジャージ番号認識データセットを紹介し,この問題に対してシーンテキスト認識手法をどのように適用できるかを考察する。
我々は,イメージレベルのタスクとトラックレットレベルのタスクで高いパフォーマンスを示し,ホッケーのイメージでは91.4%,サッカーのトラックレットでは87.4%の精度を達成した。
- 参考スコア(独自算出の注目度): 5.985204759362746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Jersey number recognition is an important task in sports video analysis, partly due to its importance for long-term player tracking. It can be viewed as a variant of scene text recognition. However, there is a lack of published attempts to apply scene text recognition models on jersey number data. Here we introduce a novel public jersey number recognition dataset for hockey and study how scene text recognition methods can be adapted to this problem. We address issues of occlusions and assess the degree to which training on one sport (hockey) can be generalized to another (soccer). For the latter, we also consider how jersey number recognition at the single-image level can be aggregated across frames to yield tracklet-level jersey number labels. We demonstrate high performance on image- and tracklet-level tasks, achieving 91.4% accuracy for hockey images and 87.4% for soccer tracklets. Code, models, and data are available at https://github.com/mkoshkina/jersey-number-pipeline.
- Abstract(参考訳): ジャージーの数字認識はスポーツビデオ解析において重要な課題であり、その理由の一部は長期の選手追跡において重要であるためである。
これはシーンテキスト認識の亜種と見なすことができる。
しかし、ジャージ番号データにシーンテキスト認識モデルを適用する試みは、公表されていない。
本稿では,ホッケーのための新しいパブリックジャージ番号認識データセットを紹介し,この問題に対してシーンテキスト認識手法をどのように適用できるかを考察する。
我々は,オクルージョンの問題に対処し,あるスポーツ(ホッケー)のトレーニングが他のスポーツ(サッカー)に一般化できる程度を評価する。
後者については、シングルイメージレベルでのジャージ番号認識をフレーム全体に集約してトラックレットレベルのジャージ番号ラベルを生成する方法についても検討する。
我々は,イメージレベルのタスクとトラックレットレベルのタスクで高いパフォーマンスを示し,ホッケーのイメージでは91.4%,サッカーのトラックレットでは87.4%の精度を達成した。
コード、モデル、データはhttps://github.com/mkoshkina/jersey-number-pipeline.comで入手できる。
関連論文リスト
- Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement [12.058303459124003]
ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
本稿では,人体方向の角度と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・スキーム(ADRS)を提案する。
論文 参考訳(メタデータ) (2024-06-03T06:35:11Z) - SoccerNet Game State Reconstruction: End-to-End Athlete Tracking and Identification on a Minimap [102.5232204867158]
我々は、ゲーム状態再構成のタスクを形式化し、フットボールビデオに焦点を当てた新しいゲーム状態再構成データセットである、サッカーネット-GSRを紹介する。
SoccerNet-GSRは、ピッチローカライゼーションとカメラキャリブレーションのための937万行のアノテートにより、30秒間の200の動画シーケンスで構成されている。
我々の実験は、GSRは挑戦的な新しい課題であり、将来の研究の場を開くことを示している。
論文 参考訳(メタデータ) (2024-04-17T12:53:45Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - Jersey Number Recognition using Keyframe Identification from
Low-Resolution Broadcast Videos [7.776923607006088]
プレイヤー識別は、プレイヤーアセスメント、ゲーム内分析、放送アセスメントなどの様々なタスクを可能にする、ビジョン駆動型サッカー分析において重要な要素である。
以前の手法では画像データでは成功したが、ほとんどのフレームではジャージ番号が見えない実世界のビデオデータに苦戦している。
本稿では,ジャージ数に関する重要な高レベル情報を含むフレームを抽出する,ロバストな下流識別モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-12T14:43:50Z) - GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for
Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。
私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文 参考訳(メタデータ) (2023-03-26T08:43:36Z) - P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos [64.57435509822416]
この作品は、ワールド・テーブルテニス選手権とオリンピアードのプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
強調局所化と強調認識という2つのアクション検出問題を定式化する。
その結果、TheNameは依然として困難なタスクであり、ビデオからの高密度なアクション検出のための特別なベンチマークとして使用できることを確認した。
論文 参考訳(メタデータ) (2022-07-26T08:34:17Z) - A Survey on Video Action Recognition in Sports: Datasets, Methods and
Applications [60.3327085463545]
本稿では,スポーツ分析のための映像行動認識に関する調査を行う。
サッカー、バスケットボール、バレーボール、ホッケー、フィギュアスケート、体操、卓球、ダイビング、バドミントンなど10種以上のスポーツを紹介します。
本研究では,サッカー,バスケットボール,卓球,フィギュアスケート動作認識をサポートするPaddlePaddleを用いたツールボックスを開発した。
論文 参考訳(メタデータ) (2022-06-02T13:19:36Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Knock, knock. Who's there? -- Identifying football player jersey numbers
with synthetic data [0.0]
シアトル・シーホークスの練習ビデオから得られた,小型で不均衡なデータセットにおいて,ジャージ番号識別のための新しい手法を提案する。
以上の結果から, 単純なモデルではジャージ数検出タスクで許容性能が得られ, 合成データにより性能が劇的に向上することが示唆された。
論文 参考訳(メタデータ) (2022-03-01T20:44:34Z) - Ice hockey player identification via transformers [11.28395713457468]
そこで我々は,NHL(National Hockey League)ビデオで選手のジャージー番号を識別するトランスフォーマーネットワークを導入する。
提案するネットワークは、使用したデータセットの以前のベンチマークよりもパフォーマンスがよい。
また,光学式文字認識(OCR)を用いてゲーム時間を読み取ることで,NHLプレイバイプレイデータで利用可能なプレイヤーシフトを利用して,特定のゲーム時間でプレイヤーをアイスリンクに誘導する。
論文 参考訳(メタデータ) (2021-11-22T21:10:26Z) - Player Identification in Hockey Broadcast Videos [18.616544581429835]
我々はNHL放送におけるホッケー選手識別の問題を解決するために,深層畳み込みニューラルネットワークアプローチを提案する。
本稿では,ResNet+LSTMネットワークの出力を分類するために,2次1次元畳み込みニューラルネットワークをレイトスコアレベル融合法として利用する。
これにより、新しいデータセットのテスト分割で、全体的なプレイヤー識別精度が87%以上になる。
論文 参考訳(メタデータ) (2020-09-05T01:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。