論文の概要: DeepSportLab: a Unified Framework for Ball Detection, Player Instance
Segmentation and Pose Estimation in Team Sports Scenes
- arxiv url: http://arxiv.org/abs/2112.00627v1
- Date: Wed, 1 Dec 2021 16:30:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 14:54:54.509575
- Title: DeepSportLab: a Unified Framework for Ball Detection, Player Instance
Segmentation and Pose Estimation in Team Sports Scenes
- Title(参考訳): DeepSportLab: チームスポーツシーンにおけるボール検出,プレーヤインスタンスのセグメンテーション,ポス推定のための統一フレームワーク
- Authors: Seyed Abolfazl Ghasemzadeh, Gabriel Van Zandycke, Maxime Istasse,
Niels Sayez, Amirafshar Moshtaghpour, Christophe De Vleeschouwer
- Abstract要約: 本稿では,(i)ボールの位置,(ii)ポーズの予測,および(iii)チームスポーツシーンにおける選手のインスタンスマスクをセグメント化するための統一的な枠組みを提案する。
- 参考スコア(独自算出の注目度): 19.845244830593067
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a unified framework to (i) locate the ball, (ii) predict
the pose, and (iii) segment the instance mask of players in team sports scenes.
Those problems are of high interest in automated sports analytics, production,
and broadcast. A common practice is to individually solve each problem by
exploiting universal state-of-the-art models, \eg, Panoptic-DeepLab for player
segmentation. In addition to the increased complexity resulting from the
multiplication of single-task models, the use of the off-the-shelf models also
impedes the performance due to the complexity and specificity of the team
sports scenes, such as strong occlusion and motion blur. To circumvent those
limitations, our paper proposes to train a single model that simultaneously
predicts the ball and the player mask and pose by combining the part intensity
fields and the spatial embeddings principles. Part intensity fields provide the
ball and player location, as well as player joints location. Spatial embeddings
are then exploited to associate player instance pixels to their respective
player center, but also to group player joints into skeletons. We demonstrate
the effectiveness of the proposed model on the DeepSport basketball dataset,
achieving comparable performance to the SoA models addressing each individual
task separately.
- Abstract(参考訳): 本稿では,統一的な枠組みを提案する。
(i)ボールの位置を定める。
(ii)ポーズを予測し、
(iii)チームスポーツシーンの選手のインスタンスマスクをセグメンテーションする。
これらの問題は、自動スポーツ分析、生産、放送に高い関心を寄せている。
一般的なプラクティスは、プレイヤーセグメンテーションに普遍的な最先端モデルである \eg, Panoptic-DeepLab を活用することで、個々の問題を解決することである。
シングルタスクモデルの乗算による複雑さの増加に加えて、オフ・ザ・シェルフモデルの使用は、強いオクルージョンや動きのぼやきといったチームのスポーツシーンの複雑さと特異性によってパフォーマンスを阻害している。
これらの制約を回避するために,ボールとプレーヤマスクを同時に予測し,部分強度場と空間埋め込み原理を組み合わせることでポーズを呈する単一モデルのトレーニングを提案する。
部分強度フィールドは、ボールとプレーヤーの位置、およびプレーヤーの関節の位置を提供する。
空間埋め込みはプレイヤーのインスタンスピクセルをそれぞれのプレイヤーセンターに関連付けるだけでなく、プレイヤージョイントをスケルトンにグループ化する。
提案モデルの有効性をDeepSportのバスケットボールデータセット上で実証し,各タスクを個別に扱うSoAモデルに匹敵する性能を実現する。
関連論文リスト
- Object-level Scene Deocclusion [92.39886029550286]
オブジェクトレベルのシーン・デクルージョンのためのPArallel可視・コミュールト拡散フレームワークPACOを提案する。
PACOをトレーニングするために、500kサンプルの大規模なデータセットを作成し、自己教師付き学習を可能にします。
COCOAと様々な現実世界のシーンの実験では、PACOがシーンの排除に優れた能力を示し、芸術の状態をはるかに上回っている。
論文 参考訳(メタデータ) (2024-06-11T20:34:10Z) - Unifying Global and Local Scene Entities Modelling for Precise Action Spotting [5.474440128682843]
本稿では,アダプティブ・アテンション・メカニズムを用いてシーン・エンティティを解析・モデル化する手法を提案する。
我々のモデルは優れたパフォーマンスを示しており、サッカーネットv2アクションスポッティング、ファインディビング、ファインジムの課題において、第1位を確保している。
論文 参考訳(メタデータ) (2024-04-15T17:24:57Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - Estimation of control area in badminton doubles with pose information
from top and back view drone videos [11.679451300997016]
我々はバドミントンダブルスでトップとバックビューから最初の注釈付きドローンデータセットを提示する。
チームワークのパフォーマンスを評価するために,制御領域の確率マップを推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-07T11:18:39Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Sports Video Analysis on Large-Scale Data [10.24207108909385]
本稿では,スポーツビデオにおける自動機械記述のモデル化について検討する。
スポーツビデオ分析のためのNBAデータセット(NSVA)を提案する。
論文 参考訳(メタデータ) (2022-08-09T16:59:24Z) - Graph Neural Networks to Predict Sports Outcomes [0.0]
スポーツに依存しないグラフによるゲーム状態の表現を導入する。
次に、提案したグラフ表現をグラフニューラルネットワークの入力として使用し、スポーツ結果を予測する。
論文 参考訳(メタデータ) (2022-07-28T14:45:02Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Unsupervised Object Learning via Common Fate [61.14802390241075]
ビデオから生成オブジェクトモデルを学習することは、長い問題であり、因果的シーンモデリングに必要である。
この問題を3つの簡単なサブタスクに分解し、それぞれに候補解を提供する。
提案手法は,入力ビデオのオクルージョンを超えて一般化された生成モデルを学習することができることを示す。
論文 参考訳(メタデータ) (2021-10-13T08:22:04Z) - Predicting the outcome of team movements -- Player time series analysis
using fuzzy and deep methods for representation learning [0.0]
我々は、より拡張された一連の動きや戦術計画において、短い戦術と宇宙占領の有用なエンコーディングのためのフレームワークを提供する。
本稿では,2015-16シーズンのプロバスケットボールSportVUデータセットにおける予測・認識タスクに対する提案手法の有効性について検討する。
論文 参考訳(メタデータ) (2021-09-13T18:42:37Z) - Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts [86.56462654572813]
私たちは、サッカーの試合の主なアクションを一時的にローカライズするサッカー放送におけるアクションスポッティングの分析に焦点を当てています。
時間的知識を組み込んだNetVLAD++という,NetVLADに基づく新たな機能プーリング手法を提案する。
我々は最近の大規模データセット SoccerNet-v2 の方法論をトレーニングし、評価し、アクションスポッティングのための平均平均mAP 53.4% に達した。
論文 参考訳(メタデータ) (2021-04-14T11:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。