論文の概要: TTNet: Real-time temporal and spatial video analysis of table tennis
- arxiv url: http://arxiv.org/abs/2004.09927v1
- Date: Tue, 21 Apr 2020 11:57:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:16:36.042943
- Title: TTNet: Real-time temporal and spatial video analysis of table tennis
- Title(参考訳): TTNet:卓球の実時間・空間映像解析
- Authors: Roman Voeikov, Nikolay Falaleev and Ruslan Baikulov
- Abstract要約: 本稿では,高精細度卓球ビデオのリアルタイム処理を目的としたニューラルネットワークを提案する。
このアプローチは、自動参照システムによるスコア更新を推論するためのコア情報を提供する。
イベントをラベル付けした120fpsのテーブルテニスゲームのビデオ付きマルチタスクデータセットOpenTTGamesを公開している。
- 参考スコア(独自算出の注目度): 5.156484100374058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a neural network TTNet aimed at real-time processing of
high-resolution table tennis videos, providing both temporal (events spotting)
and spatial (ball detection and semantic segmentation) data. This approach
gives core information for reasoning score updates by an auto-referee system.
We also publish a multi-task dataset OpenTTGames with videos of table tennis
games in 120 fps labeled with events, semantic segmentation masks, and ball
coordinates for evaluation of multi-task approaches, primarily oriented on
spotting of quick events and small objects tracking. TTNet demonstrated 97.0%
accuracy in game events spotting along with 2 pixels RMSE in ball detection
with 97.5% accuracy on the test part of the presented dataset.
The proposed network allows the processing of downscaled full HD videos with
inference time below 6 ms per input tensor on a machine with a single
consumer-grade GPU. Thus, we are contributing to the development of real-time
multi-task deep learning applications and presenting approach, which is
potentially capable of substituting manual data collection by sports scouts,
providing support for referees' decision-making, and gathering extra
information about the game process.
- Abstract(参考訳): 本稿では,高精細度卓球ビデオのリアルタイム処理を目的としたニューラルネットワークTTNetを提案し,時間的(イベントスポッティング)と空間的(ボール検出とセマンティックセグメンテーション)の両方のデータを提供する。
このアプローチは、自動参照システムによるスコア更新を推論するためのコア情報を提供する。
また,イベント,セマンティックセグメンテーションマスク,ボール座標をラベル付けした120fpsのテーブルテニスゲームのビデオ付きマルチタスクデータセットOpenTTGamesを公開し,高速なイベントの発見と小さなオブジェクト追跡を主目的としたマルチタスクアプローチの評価を行った。
ttnetは、ゲームイベントにおける97.0%の精度を示し、2ピクセルrmseでボール検出を行い、97.5%の精度を示した。
提案ネットワークでは,1つのコンシューマグレードGPUを持つマシン上で,入力テンソルあたり6ミリ秒未満の推論時間で,ダウンスケールされたフルHDビデオの処理を可能にする。
そこで,我々は,スポーツスカウトによる手作業データ収集の代替,審判の意思決定支援,ゲームプロセスに関する追加情報収集が可能な,リアルタイムのマルチタスク深層学習アプリケーションの開発と提示手法の開発に寄与している。
関連論文リスト
- Perception Test: A Diagnostic Benchmark for Multimodal Video Models [78.64546291816117]
本稿では,事前学習したマルチモーダルモデルの知覚と推論能力を評価するために,新しいマルチモーダルビデオベンチマークを提案する。
知覚テストは、スキル(記憶、抽象化、物理学、セマンティックス)と、ビデオ、オーディオ、テキストモダリティ間の推論(記述的、説明的、予測的、反ファクト的)のタイプに焦点を当てている。
このベンチマークは、ゼロショット/少数ショットまたは限定的な微調整方式で、転送機能の事前訓練されたモデルを探索する。
論文 参考訳(メタデータ) (2023-05-23T07:54:37Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - Table Tennis Stroke Detection and Recognition Using Ball Trajectory Data [5.735035463793008]
4人のプロの卓球選手が実行した6つのストローククラスからなるデータセットを取得するために、審判の視点に配置された1台のカメラが使用されている。
従来のオブジェクト検出モデルであるYOLOv4と、時間熱マップベースのモデルであるTrackNetv2を用いたボール追跡がデータセット上に実装されている。
球軌道データを用いてストロークの時間的境界を抽出する数学的アプローチにより,2023個の有効なストロークが得られた。
時間畳み込みネットワークは87.155%の精度で全く見えないデータでストローク認識を実行した。
論文 参考訳(メタデータ) (2023-02-19T19:13:24Z) - P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos [64.57435509822416]
この作品は、ワールド・テーブルテニス選手権とオリンピアードのプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
強調局所化と強調認識という2つのアクション検出問題を定式化する。
その結果、TheNameは依然として困難なタスクであり、ビデオからの高密度なアクション検出のための特別なベンチマークとして使用できることを確認した。
論文 参考訳(メタデータ) (2022-07-26T08:34:17Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Table Tennis Stroke Recognition Using Two-Dimensional Human Pose
Estimation [0.0]
本稿では,卓球映像データを集め,ストローク検出と分類を行う新しい手法を提案する。
14人のプロ卓球選手から得られた11の基本的なストロークのビデオデータを含む多様なデータセットが収集されている。
2次元ポーズ推定を用いて開発された時間畳み込みニューラルネットワークモデルは、これら11の卓球ストロークのマルチクラス分類を行う。
論文 参考訳(メタデータ) (2021-04-20T11:32:43Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z) - Fast Video Object Segmentation With Temporal Aggregation Network and
Dynamic Template Matching [67.02962970820505]
ビデオオブジェクト(VOS)に「トラッキング・バイ・検出」を導入する。
本稿では,時間的アグリゲーションネットワークと動的時間進化テンプレートマッチング機構を提案する。
我々は,DAVISベンチマークで1フレームあたり0.14秒,J&Fで75.9%の速度で,複雑なベルとホイッスルを伴わずに,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-11T05:44:16Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。