論文の概要: Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement
- arxiv url: http://arxiv.org/abs/2406.01033v1
- Date: Mon, 3 Jun 2024 06:35:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 02:17:50.682198
- Title: Generalized Jersey Number Recognition Using Multi-task Learning With Orientation-guided Weight Refinement
- Title(参考訳): 配向誘導重み補正を用いたマルチタスク学習を用いた一般化ジャージ数認識
- Authors: Yung-Hui Lin, Yu-Wen Chang, Huang-Chia Shih, Takahiro Ogawa,
- Abstract要約: ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
本稿では,人体方向の角度と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・スキーム(ADRS)を提案する。
- 参考スコア(独自算出の注目度): 12.058303459124003
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Jersey number recognition (JNR) has always been an important task in sports analytics. Improving recognition accuracy remains an ongoing challenge because images are subject to blurring, occlusion, deformity, and low resolution. Recent research has addressed these problems using number localization and optical character recognition. Some approaches apply player identification schemes to image sequences, ignoring the impact of human body rotation angles on jersey digit identification. Accurately predicting the number of jersey digits by using a multi-task scheme to recognize each individual digit enables more robust results. Based on the above considerations, this paper proposes a multi-task learning method called the angle-digit refine scheme (ADRS), which combines human body orientation angles and digit number clues to recognize athletic jersey numbers. Based on our experimental results, our approach increases inference information, significantly improving prediction accuracy. Compared to state-of-the-art methods, which can only handle a single type of sport, the proposed method produces a more diverse and practical JNR application. The incorporation of diverse types of team sports such as soccer, football, basketball, volleyball, and baseball into our dataset contributes greatly to generalized JNR in sports analytics. Our accuracy achieves 64.07% on Top-1 and 89.97% on Top-2, with corresponding F1 scores of 67.46% and 90.64%, respectively.
- Abstract(参考訳): ジャージー番号認識(JNR)はスポーツ分析において常に重要な課題である。
画像がぼやけ、隠蔽、変形、解像度の低いため、認識精度の向上は現在も進行中の課題である。
近年の研究では、数値ローカライゼーションと光学的文字認識を用いてこの問題に対処している。
いくつかのアプローチでは、人体回転角がジャージの数字の識別に与える影響を無視して、プレイヤー識別スキームを画像シーケンスに適用している。
マルチタスクスキームを用いて各数字を正確に予測することで、より堅牢な結果が得られる。
そこで本研究では,人体方向角と数字の手がかりを組み合わせた多タスク学習手法であるアングル・ディジット・リファレンス・スキーム(ADRS)を提案する。
実験結果から,提案手法は推測情報を増加させ,予測精度を大幅に向上させる。
1種類のスポーツしか扱えない最先端の手法と比較して、提案手法はより多種多様な実用的JNRアプリケーションを生成する。
サッカー,サッカー,バスケットボール,バレーボール,野球などの多種多様なチームスポーツをデータセットに組み込むことは,スポーツ分析におけるJNRの一般化に大きく貢献する。
我々の精度はトップ1で64.07%、トップ2で89.97%、対応するF1スコアは67.46%、90.64%である。
関連論文リスト
- A General Framework for Jersey Number Recognition in Sports Video [5.985204759362746]
ジャージーの数字認識はスポーツビデオ解析において重要な課題であり、その理由の一部は長期の選手追跡において重要であるためである。
本稿では,ホッケーのための新しいパブリックジャージ番号認識データセットを紹介し,この問題に対してシーンテキスト認識手法をどのように適用できるかを考察する。
我々は,イメージレベルのタスクとトラックレットレベルのタスクで高いパフォーマンスを示し,ホッケーのイメージでは91.4%,サッカーのトラックレットでは87.4%の精度を達成した。
論文 参考訳(メタデータ) (2024-05-22T18:08:26Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - Whole-body Detection, Recognition and Identification at Altitude and
Range [57.445372305202405]
多様なデータセットに基づいて評価したエンドツーエンドシステムを提案する。
我々のアプローチでは、一般的な画像データセットで検出器を事前トレーニングし、BRIARの複雑なビデオや画像でそれを微調整する。
屋内・屋外・航空シナリオにおける様々な範囲や角度の異なる条件下で徹底的な評価を行う。
論文 参考訳(メタデータ) (2023-11-09T20:20:23Z) - Jersey Number Recognition using Keyframe Identification from
Low-Resolution Broadcast Videos [7.776923607006088]
プレイヤー識別は、プレイヤーアセスメント、ゲーム内分析、放送アセスメントなどの様々なタスクを可能にする、ビジョン駆動型サッカー分析において重要な要素である。
以前の手法では画像データでは成功したが、ほとんどのフレームではジャージ番号が見えない実世界のビデオデータに苦戦している。
本稿では,ジャージ数に関する重要な高レベル情報を含むフレームを抽出する,ロバストな下流識別モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-12T14:43:50Z) - SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - Sports Re-ID: Improving Re-Identification Of Players In Broadcast Videos
Of Team Sports [0.0]
本研究は、チームスポーツの放送ビデオにおけるプレイヤーの再識別に焦点を当てている。
具体的には、試合の特定の瞬間に異なるカメラ視点から撮影された画像において、同じプレイヤーを特定することに焦点を当てる。
論文 参考訳(メタデータ) (2022-06-06T06:06:23Z) - Knock, knock. Who's there? -- Identifying football player jersey numbers
with synthetic data [0.0]
シアトル・シーホークスの練習ビデオから得られた,小型で不均衡なデータセットにおいて,ジャージ番号識別のための新しい手法を提案する。
以上の結果から, 単純なモデルではジャージ数検出タスクで許容性能が得られ, 合成データにより性能が劇的に向上することが示唆された。
論文 参考訳(メタデータ) (2022-03-01T20:44:34Z) - Multi-task learning for jersey number recognition in Ice Hockey [9.316018917078049]
ジャージ数認識のためのマルチタスク学習ネットワークの設計と実装を行った。
提案するネットワークは,マルチタスク損失関数を用いて,全体像と数値表現の両方を学習する。
実験結果から,提案したマルチタスク学習ネットワークは,構成全体と桁単位の単一タスク学習ネットワークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-08-17T19:33:28Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。