論文の概要: SoccerKDNet: A Knowledge Distillation Framework for Action Recognition
in Soccer Videos
- arxiv url: http://arxiv.org/abs/2307.07768v2
- Date: Sat, 22 Jul 2023 04:47:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 20:10:57.784335
- Title: SoccerKDNet: A Knowledge Distillation Framework for Action Recognition
in Soccer Videos
- Title(参考訳): SoccerKDNet:サッカービデオにおける行動認識のための知識蒸留フレームワーク
- Authors: Sarosij Bose, Saikat Sarkar, Amlan Chakrabarti
- Abstract要約: 本研究では,Kinetics400データセット上で事前学習した新しいエンド・ツー・エンドの知識蒸留に基づくトランスファーラーニングネットワークを提案する。
また,448本のビデオを含むサッカーDB1という新しいデータセットを導入し,サッカーをプレーする選手の4つのクラスで構成された。
- 参考スコア(独自算出の注目度): 3.1583465114791105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classifying player actions from soccer videos is a challenging problem, which
has become increasingly important in sports analytics over the years. Most
state-of-the-art methods employ highly complex offline networks, which makes it
difficult to deploy such models in resource constrained scenarios. Here, in
this paper we propose a novel end-to-end knowledge distillation based transfer
learning network pre-trained on the Kinetics400 dataset and then perform
extensive analysis on the learned framework by introducing a unique loss
parameterization. We also introduce a new dataset named SoccerDB1 containing
448 videos and consisting of 4 diverse classes each of players playing soccer.
Furthermore, we introduce an unique loss parameter that help us linearly weigh
the extent to which the predictions of each network are utilized. Finally, we
also perform a thorough performance study using various changed
hyperparameters. We also benchmark the first classification results on the new
SoccerDB1 dataset obtaining 67.20% validation accuracy. Apart from
outperforming prior arts significantly, our model also generalizes to new
datasets easily. The dataset has been made publicly available at:
https://bit.ly/soccerdb1
- Abstract(参考訳): サッカーのビデオからプレイヤーのアクションを分類することは難しい問題であり、スポーツ分析では近年ますます重要になっている。
最先端の手法の多くは、高度に複雑なオフラインネットワークを使っているため、そのようなモデルをリソース制約のあるシナリオでデプロイするのは困難である。
本稿では,kinetics400データセット上で事前学習したエンド・ツー・エンドの知識蒸留に基づく転送学習ネットワークを提案する。
また,サッカーをプレイする選手の4つの異なるクラスからなる,448のビデオを含む新しいデータセットである soccerdb1 についても紹介する。
さらに,各ネットワークの予測の有効範囲を線形に評価する一意な損失パラメータを導入する。
最後に、様々な変化したハイパーパラメータを用いて、徹底的な性能調査を行う。
また、新しいサッカーDB1データセットの最初の分類結果をベンチマークし、67.20%の検証精度を得た。
先行技術を大幅に上回るだけでなく、我々のモデルは新しいデータセットにも容易に一般化できる。
データセットは、https://bit.ly/soccerdb1で公開されている。
関連論文リスト
- PIVOT: Prompting for Video Continual Learning [50.80141083993668]
PIVOTは、画像領域から事前学習したモデルにおける広範な知識を活用する新しい手法である。
実験の結果,PIVOTは20タスクのアクティビティネット設定において,最先端の手法を27%向上することがわかった。
論文 参考訳(メタデータ) (2022-12-09T13:22:27Z) - Offline Q-Learning on Diverse Multi-Task Data Both Scales And
Generalizes [100.69714600180895]
オフラインのQ-ラーニングアルゴリズムは、モデルキャパシティでスケールする強力なパフォーマンスを示す。
最大8000万のパラメータネットワークを用いて,40のゲームに対してほぼ人間に近いパフォーマンスで1つのポリシーをトレーニングする。
リターン条件付き教師付きアプローチと比較して、オフラインQラーニングはモデルキャパシティと同様にスケールし、特にデータセットが最適以下である場合にはパフォーマンスが向上する。
論文 参考訳(メタデータ) (2022-11-28T08:56:42Z) - Sports Video Analysis on Large-Scale Data [10.24207108909385]
本稿では,スポーツビデオにおける自動機械記述のモデル化について検討する。
スポーツビデオ分析のためのNBAデータセット(NSVA)を提案する。
論文 参考訳(メタデータ) (2022-08-09T16:59:24Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - A Multi-stage deep architecture for summary generation of soccer videos [11.41978608521222]
本稿では,音声メタデータとイベントメタデータの両方を利用して,サッカーの試合の要約を生成する手法を提案する。
その結果,提案手法は一致の動作を検出し,どの動作が要約に属するべきかを識別し,複数の候補要約を提案する。
論文 参考訳(メタデータ) (2022-05-02T07:26:35Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Semi-Supervised Training to Improve Player and Ball Detection in Soccer [11.376125584750548]
本稿では,ラベル付き画像データセットに基づいて,サッカー放送ビデオの大規模なラベル付きデータセットを活用することによって,ネットワークをトレーニングするための新しい半教師付き手法を提案する。
トレーニングプロセスにラベル付きデータを含めることで、ラベル付きデータのみに基づいてトレーニングされた検出ネットワークの性能を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-04-14T10:20:56Z) - Evaluating Soccer Player: from Live Camera to Deep Reinforcement
Learning [0.0]
オープンソースのプレイヤー追跡モデルと、Deep Reinforcement Learningのみに基づいてこれらのプレイヤーを評価する新しいアプローチの2つの部分のソリューションを紹介します。
私達の追跡モデルは私達がまた解放するデータセットの監視された方法で訓練され、私達の評価モデルは仮想サッカーゲームのシミュレーションだけに頼ります。
新たなアプローチであるExpected Discounted Goal(EDG)は、チームが特定の状態から獲得または達成できる目標の数を表します。
論文 参考訳(メタデータ) (2021-01-13T23:26:17Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Parameter-Efficient Transfer from Sequential Behaviors for User Modeling
and Recommendation [111.44445634272235]
本稿では,PeterRecと呼ばれるパラメータ効率のよい移動学習アーキテクチャを提案する。
PeterRecは、トレーニング済みのパラメータを、一連の再学習ニューラルネットワークを注入することで、微調整中に修正されないようにする。
我々は5つの下流タスクにおいて学習したユーザ表現の有効性を示すために、広範囲な実験的アブレーションを行う。
論文 参考訳(メタデータ) (2020-01-13T14:09:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。