論文の概要: Table Tennis Stroke Recognition Using Two-Dimensional Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2104.09907v1
- Date: Tue, 20 Apr 2021 11:32:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 13:49:25.422083
- Title: Table Tennis Stroke Recognition Using Two-Dimensional Human Pose
Estimation
- Title(参考訳): 二次元姿勢推定を用いたテーブルテニスストローク認識
- Authors: Kaustubh Milind Kulkarni and Sucheth Shenoy
- Abstract要約: 本稿では,卓球映像データを集め,ストローク検出と分類を行う新しい手法を提案する。
14人のプロ卓球選手から得られた11の基本的なストロークのビデオデータを含む多様なデータセットが収集されている。
2次元ポーズ推定を用いて開発された時間畳み込みニューラルネットワークモデルは、これら11の卓球ストロークのマルチクラス分類を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce a novel method for collecting table tennis video data and
perform stroke detection and classification. A diverse dataset containing video
data of 11 basic strokes obtained from 14 professional table tennis players,
summing up to a total of 22111 videos has been collected using the proposed
setup. The temporal convolutional neural network model developed using 2D pose
estimation performs multiclass classification of these 11 table tennis strokes
with a validation accuracy of 99.37%. Moreover, the neural network generalizes
well over the data of a player excluded from the training and validation
dataset, classifying the fresh strokes with an overall best accuracy of 98.72%.
Various model architectures using machine learning and deep learning based
approaches have been trained for stroke recognition and their performances have
been compared and benchmarked. Inferences such as performance monitoring and
stroke comparison of the players using the model have been discussed.
Therefore, we are contributing to the development of a computer vision based
sports analytics system for the sport of table tennis that focuses on the
previously unexploited aspect of the sport i.e., a player's strokes, which is
extremely insightful for performance improvement.
- Abstract(参考訳): 本稿では,卓球映像データを集め,ストローク検出と分類を行う新しい手法を提案する。
14人のプロ卓球選手から得られた11の基本的なストロークのビデオデータを含む多種多様なデータセットを,提案手法を用いて合計22111本の動画を収集した。
2次元ポーズ推定を用いて開発された時間畳み込みニューラルネットワークモデルは、99.37%の精度で11のテーブルテニスストロークのマルチクラス分類を行う。
さらに、ニューラルネットワークはトレーニングとバリデーションデータセットから除外されたプレイヤーのデータよりもよく一般化され、新鮮なストロークを98.72%の精度で分類する。
機械学習とディープラーニングに基づくアプローチを用いた様々なモデルアーキテクチャがストローク認識のために訓練され、それらの性能の比較とベンチマークが行われた。
モデルを用いた選手のパフォーマンスモニタリングやストローク比較などの推論について論じている。
そこで本研究では,前回未発表のスポーツ,すなわち選手のストロークに焦点をあてた卓球スポーツのコンピュータビジョンに基づくスポーツ分析システムの開発に寄与する。
関連論文リスト
- Classification of Tennis Actions Using Deep Learning [0.0]
本研究では,深層学習によるテニス行動の分類の可能性と課題について検討する。
テニスデータセットTheTISを用いて,異なる大きさの3つのモデルを訓練し,評価した。
最高のモデルは74 %の一般化精度を達成し、テニスアクション分類に優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-04T15:48:20Z) - Design of Recognition and Evaluation System for Table Tennis Players'
Motor Skills Based on Artificial Intelligence [3.4701250324316146]
本稿では,卓球競技のウェアラブル装置を改良し,人工知能による卓球選手の運動能力のパターン認識と評価を実現する。
スライドウインドウは、収集した動きデータを6つのテーブルテニスベンチマーク運動の特徴データベースに分割する。
異なる評価指標の損失関数を用いて、モータスキルの階層的評価システムを確立する。
論文 参考訳(メタデータ) (2023-09-04T14:58:56Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - Supervised Learning for Table Tennis Match Prediction [2.7835697868135902]
本稿では,テーブルテニスシングルマッチの結果を予測するために機械学習を用いることを提案する。
我々は,プレイヤーとマッチング統計を特徴として用いて,その相対的重要性をアブレーション研究で評価する。
結果は将来の卓球予測モデルのベースラインとして機能し、同様の球技の予測研究にフィードバックすることができる。
論文 参考訳(メタデータ) (2023-03-28T17:42:13Z) - Table Tennis Stroke Detection and Recognition Using Ball Trajectory Data [5.735035463793008]
4人のプロの卓球選手が実行した6つのストローククラスからなるデータセットを取得するために、審判の視点に配置された1台のカメラが使用されている。
従来のオブジェクト検出モデルであるYOLOv4と、時間熱マップベースのモデルであるTrackNetv2を用いたボール追跡がデータセット上に実装されている。
球軌道データを用いてストロークの時間的境界を抽出する数学的アプローチにより,2023個の有効なストロークが得られた。
時間畳み込みネットワークは87.155%の精度で全く見えないデータでストローク認識を実行した。
論文 参考訳(メタデータ) (2023-02-19T19:13:24Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos [64.57435509822416]
この作品は、ワールド・テーブルテニス選手権とオリンピアードのプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
強調局所化と強調認識という2つのアクション検出問題を定式化する。
その結果、TheNameは依然として困難なタスクであり、ビデオからの高密度なアクション検出のための特別なベンチマークとして使用できることを確認した。
論文 参考訳(メタデータ) (2022-07-26T08:34:17Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - TTNet: Real-time temporal and spatial video analysis of table tennis [5.156484100374058]
本稿では,高精細度卓球ビデオのリアルタイム処理を目的としたニューラルネットワークを提案する。
このアプローチは、自動参照システムによるスコア更新を推論するためのコア情報を提供する。
イベントをラベル付けした120fpsのテーブルテニスゲームのビデオ付きマルチタスクデータセットOpenTTGamesを公開している。
論文 参考訳(メタデータ) (2020-04-21T11:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。