論文の概要: Multi-task learning for jersey number recognition in Ice Hockey
- arxiv url: http://arxiv.org/abs/2108.07848v1
- Date: Tue, 17 Aug 2021 19:33:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-20 00:24:14.346251
- Title: Multi-task learning for jersey number recognition in Ice Hockey
- Title(参考訳): アイスホッケーにおけるジャージ数認識のためのマルチタスク学習
- Authors: Kanav Vats, Mehrnaz Fani, David A. Clausi and John Zelek
- Abstract要約: ジャージ数認識のためのマルチタスク学習ネットワークの設計と実装を行った。
提案するネットワークは,マルチタスク損失関数を用いて,全体像と数値表現の両方を学習する。
実験結果から,提案したマルチタスク学習ネットワークは,構成全体と桁単位の単一タスク学習ネットワークよりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 9.316018917078049
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying players in sports videos by recognizing their jersey numbers is a
challenging task in computer vision. We have designed and implemented a
multi-task learning network for jersey number recognition. In order to train a
network to recognize jersey numbers, two output label representations are used
(1) Holistic - considers the entire jersey number as one class, and (2)
Digit-wise - considers the two digits in a jersey number as two separate
classes. The proposed network learns both holistic and digit-wise
representations through a multi-task loss function. We determine the optimal
weights to be assigned to holistic and digit-wise losses through an ablation
study. Experimental results demonstrate that the proposed multi-task learning
network performs better than the constituent holistic and digit-wise
single-task learning networks.
- Abstract(参考訳): ジャージ番号を認識することでスポーツビデオのプレイヤーを識別することは、コンピュータビジョンにおいて難しい課題である。
ジャージ数認識のためのマルチタスク学習ネットワークの設計と実装を行った。
ジャージー番号を識別するためにネットワークを訓練するために、2つの出力ラベル表現が使用される(1) ジャージー番号全体を1つのクラスとして、(2) 数字的に、2つの数字を2つの別々のクラスとして扱う。
提案するネットワークは,マルチタスク損失関数を用いて,全体像と数値表現の両方を学習する。
アブレーション研究により, 総括的および数字的損失に割り当てられる最適重みを決定する。
実験により,提案するマルチタスク学習ネットワークは,全体的および指方向のシングルタスク学習ネットワークよりも優れた性能を示す。
関連論文リスト
- Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement [12.058303459124003]
ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
本稿では,人体方向の角度と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・スキーム(ADRS)を提案する。
論文 参考訳(メタデータ) (2024-06-03T06:35:11Z) - A General Framework for Jersey Number Recognition in Sports Video [5.985204759362746]
ジャージーの数字認識はスポーツビデオ解析において重要な課題であり、その理由の一部は長期の選手追跡において重要であるためである。
本稿では,ホッケーのための新しいパブリックジャージ番号認識データセットを紹介し,この問題に対してシーンテキスト認識手法をどのように適用できるかを考察する。
我々は,イメージレベルのタスクとトラックレットレベルのタスクで高いパフォーマンスを示し,ホッケーのイメージでは91.4%,サッカーのトラックレットでは87.4%の精度を達成した。
論文 参考訳(メタデータ) (2024-05-22T18:08:26Z) - Jersey Number Recognition using Keyframe Identification from
Low-Resolution Broadcast Videos [7.776923607006088]
プレイヤー識別は、プレイヤーアセスメント、ゲーム内分析、放送アセスメントなどの様々なタスクを可能にする、ビジョン駆動型サッカー分析において重要な要素である。
以前の手法では画像データでは成功したが、ほとんどのフレームではジャージ番号が見えない実世界のビデオデータに苦戦している。
本稿では,ジャージ数に関する重要な高レベル情報を含むフレームを抽出する,ロバストな下流識別モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-12T14:43:50Z) - Multitask Learning with No Regret: from Improved Confidence Bounds to
Active Learning [79.07658065326592]
推定タスクの不確実性の定量化は、オンラインやアクティブな学習など、多くの下流アプリケーションにとって重要な課題である。
タスク間の類似性やタスクの特徴を学習者に提供できない場合、課題設定において新しいマルチタスク信頼区間を提供する。
本稿では,このパラメータを事前に知らないまま,このような改善された後悔を実現する新しいオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-03T13:08:09Z) - Automated player identification and indexing using two-stage deep
learning network [0.23610495849936355]
本稿では,アメリカンフットボールの試合における選手の参加を自動的に追跡し,その参加度を指標とする深層学習型選手追跡システムを提案する。
関心領域をハイライトし、ジャージ番号情報を高精度に識別するための2段階ネットワーク設計である。
フットボールビデオの質的,定量的な結果を分析することにより,選手追跡システムの有効性と信頼性を実証する。
論文 参考訳(メタデータ) (2022-04-26T02:59:03Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - Multi-script Handwritten Digit Recognition Using Multi-task Learning [2.8698937226234795]
堅牢で多目的なシステムの開発を促進するマルチスクリプトの桁認識では、あまり一般的ではない。
本研究では,マルチタスク学習を用いた手書き文字認識について検討する。
ラテン文字、アラビア文字、カンナダ文字を含む3文字の手書き桁は、個々のタスクを書き換えたマルチタスクモデルが有望な結果を示していることを示すために研究されている。
論文 参考訳(メタデータ) (2021-06-15T16:30:37Z) - A robot that counts like a child: a developmental model of counting and
pointing [69.26619423111092]
実物を数えることができる新しい神経ロボティクスモデルを導入する。
このモデルにより,エンボディメントと数値認識の相互作用を調べることができる。
トレーニングされたモデルは、アイテムのセットをカウントすることができ、同時にそれらを指し示します。
論文 参考訳(メタデータ) (2020-08-05T21:06:27Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z) - MTI-Net: Multi-Scale Task Interaction Networks for Multi-Task Learning [82.62433731378455]
特定のスケールで高い親和性を持つタスクは、他のスケールでこの動作を維持することが保証されていないことを示す。
本稿では,この発見に基づく新しいアーキテクチャ MTI-Net を提案する。
論文 参考訳(メタデータ) (2020-01-19T21:02:36Z) - Uncertainty-Aware Multi-Shot Knowledge Distillation for Image-Based
Object Re-Identification [93.39253443415392]
各画像の特徴学習を指導するために,同一のアイデンティティのマルチショットを活用することを提案する。
それは、同一物体の複数の画像から包括的特徴を学習する教師ネットワーク(T-net)と、1つの画像を入力として取る学生ネットワーク(S-net)から構成される。
提案手法の有効性を,一般的な車種と個人用車種に検証した。
論文 参考訳(メタデータ) (2020-01-15T09:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。