論文の概要: Semi-Supervised Training to Improve Player and Ball Detection in Soccer
- arxiv url: http://arxiv.org/abs/2204.06859v1
- Date: Thu, 14 Apr 2022 10:20:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 13:43:23.532413
- Title: Semi-Supervised Training to Improve Player and Ball Detection in Soccer
- Title(参考訳): サッカーにおけるプレーヤとボール検出を改善するセミスーパービジョントレーニング
- Authors: Renaud Vandeghen, Anthony Cioppa, Marc Van Droogenbroeck
- Abstract要約: 本稿では,ラベル付き画像データセットに基づいて,サッカー放送ビデオの大規模なラベル付きデータセットを活用することによって,ネットワークをトレーニングするための新しい半教師付き手法を提案する。
トレーニングプロセスにラベル付きデータを含めることで、ラベル付きデータのみに基づいてトレーニングされた検出ネットワークの性能を大幅に改善できることを示す。
- 参考スコア(独自算出の注目度): 11.376125584750548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate player and ball detection has become increasingly important in
recent years for sport analytics. As most state-of-the-art methods rely on
training deep learning networks in a supervised fashion, they require huge
amounts of annotated data, which are rarely available. In this paper, we
present a novel generic semi-supervised method to train a network based on a
labeled image dataset by leveraging a large unlabeled dataset of soccer
broadcast videos. More precisely, we design a teacher-student approach in which
the teacher produces surrogate annotations on the unlabeled data to be used
later for training a student which has the same architecture as the teacher.
Furthermore, we introduce three training loss parametrizations that allow the
student to doubt the predictions of the teacher during training depending on
the proposal confidence score. We show that including unlabeled data in the
training process allows to substantially improve the performances of the
detection network trained only on the labeled data. Finally, we provide a
thorough performance study including different proportions of labeled and
unlabeled data, and establish the first benchmark on the new SoccerNet-v3
detection task, with an mAP of 52.3%. Our code is available at
https://github.com/rvandeghen/SST .
- Abstract(参考訳): 近年,スポーツ分析において選手とボールの正確な検出が重要になっている。
最先端の手法の多くは、教師ありの方法でディープラーニングネットワークのトレーニングに依存しているため、大量の注釈付きデータを必要とする。
本稿では,サッカー放送映像の大きなラベルなしデータセットを利用して,ラベル付き画像データセットに基づいてネットワークを訓練する新しい汎用半教師あり方式を提案する。
より正確には、教師と同じアーキテクチャの学生を訓練するために、教師が後で使用するラベル付きデータに代用アノテーションを生成する教師学生アプローチを設計する。
さらに,提案の信頼性スコアに応じて,教師の予測を疑うことができる3つの学習損失パラメトリゼーションを導入する。
学習プロセスにラベルなしデータを含めることで,ラベル付きデータのみにトレーニングされた検出ネットワークの性能が大幅に向上することを示す。
最後に、ラベル付きデータとラベルなしデータの比率の異なる徹底的な性能調査を行い、新しい SoccerNet-v3 検出タスクの最初のベンチマークを作成し、mAP は52.3% である。
私たちのコードはhttps://github.com/rvandeghen/SST で利用可能です。
関連論文リスト
- SoccerKDNet: A Knowledge Distillation Framework for Action Recognition
in Soccer Videos [3.1583465114791105]
本研究では,Kinetics400データセット上で事前学習した新しいエンド・ツー・エンドの知識蒸留に基づくトランスファーラーニングネットワークを提案する。
また,448本のビデオを含むサッカーDB1という新しいデータセットを導入し,サッカーをプレーする選手の4つのクラスで構成された。
論文 参考訳(メタデータ) (2023-07-15T10:43:24Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Pushing the Envelope for Depth-Based Semi-Supervised 3D Hand Pose
Estimation with Consistency Training [2.6954666679827137]
ラベル付きトレーニングデータへの依存を著しく低減する半教師付き手法を提案する。
提案手法は,教師ネットワークと学生ネットワークの2つの同一ネットワークを共同で訓練した。
実験により,提案手法は最先端の半教師付き手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-03-27T12:32:49Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - Uncertainty-aware Self-training for Text Classification with Few Labels [54.13279574908808]
本研究は,アノテーションのボトルネックを軽減するための半教師あり学習手法の1つとして,自己学習について研究する。
本稿では,基礎となるニューラルネットワークの不確実性推定を取り入れて,自己学習を改善する手法を提案する。
本手法では,クラス毎に20~30個のラベル付きサンプルをトレーニングに利用し,完全教師付き事前学習言語モデルの3%以内で検証を行う。
論文 参考訳(メタデータ) (2020-06-27T08:13:58Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。