論文の概要: BASKET: A Large-Scale Video Dataset for Fine-Grained Skill Estimation
- arxiv url: http://arxiv.org/abs/2503.20781v1
- Date: Wed, 26 Mar 2025 17:59:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:20:06.975257
- Title: BASKET: A Large-Scale Video Dataset for Fine-Grained Skill Estimation
- Title(参考訳): BASKET: 細粒度スキル推定のための大規模ビデオデータセット
- Authors: Yulu Pan, Ce Zhang, Gedas Bertasius,
- Abstract要約: BASKETには、世界中の32,232人のバスケットボール選手を撮影する4,477時間のビデオがある。
私たちのデータセットには、性別、年齢、スキルレベル、地理的位置といった、前例のない多様性を持つ、膨大な数の熟練した参加者が含まれています。
- 参考スコア(独自算出の注目度): 23.088610274138848
- License:
- Abstract: We present BASKET, a large-scale basketball video dataset for fine-grained skill estimation. BASKET contains 4,477 hours of video capturing 32,232 basketball players from all over the world. Compared to prior skill estimation datasets, our dataset includes a massive number of skilled participants with unprecedented diversity in terms of gender, age, skill level, geographical location, etc. BASKET includes 20 fine-grained basketball skills, challenging modern video recognition models to capture the intricate nuances of player skill through in-depth video analysis. Given a long highlight video (8-10 minutes) of a particular player, the model needs to predict the skill level (e.g., excellent, good, average, fair, poor) for each of the 20 basketball skills. Our empirical analysis reveals that the current state-of-the-art video models struggle with this task, significantly lagging behind the human baseline. We believe that BASKET could be a useful resource for developing new video models with advanced long-range, fine-grained recognition capabilities. In addition, we hope that our dataset will be useful for domain-specific applications such as fair basketball scouting, personalized player development, and many others. Dataset and code are available at https://github.com/yulupan00/BASKET.
- Abstract(参考訳): BASKETは,精密なスキル推定のための大規模バスケットボールビデオデータセットである。
BASKETには、世界中の32,232人のバスケットボール選手を撮影する4,477時間のビデオがある。
従来のスキル推定データセットと比較して、我々のデータセットには、性別、年齢、スキルレベル、地理的位置など、前例のない多様性を持つ、膨大な数の熟練した参加者が含まれています。
BASKETには20のきめ細かいバスケットボールスキルが含まれており、詳細なビデオ分析を通じてプレイヤースキルの複雑なニュアンスを捉えるために現代のビデオ認識モデルに挑戦している。
特定の選手の長いハイライトビデオ(8-10分)を与えられたモデルでは、20のバスケットボールスキルごとにスキルレベル(例えば、優れた、良い、平均、フェア、貧乏)を予測する必要がある。
私たちの経験的分析によると、現在の最先端のビデオモデルは、このタスクに苦戦しており、人間のベースラインにかなり遅れている。
BASKETは、高度な長距離、きめ細かな認識能力を持つ新しいビデオモデルを開発するのに有用なリソースであると考えています。
さらに、私たちのデータセットは、フェアバスケットボールスカウト、パーソナライズされたプレーヤー開発など、ドメイン固有のアプリケーションに役立ちたいと思っています。
データセットとコードはhttps://github.com/yulupan00/BASKETで入手できる。
関連論文リスト
- SkillMimic: Learning Reusable Basketball Skills from Demonstrations [85.23012579911378]
SkillMimicは、人間とボールの両方の動きを模倣して、さまざまなバスケットボールスキルを学習するデータ駆動型アプローチである。
SkillMimicは、人間とボールのモーションデータセットから多様なスキルを学ぶために、統一された構成を採用している。
SkillMimicが獲得したスキルは、高レベルのコントローラーで簡単に再利用でき、複雑なバスケットボールのタスクをこなせる。
論文 参考訳(メタデータ) (2024-08-12T15:19:04Z) - ExpertAF: Expert Actionable Feedback from Video [81.46431188306397]
ビデオのスキル評価の現在の方法は、スコアのみを提供し、デモを比較することである。
本研究では,身体活動を行う人の映像から行動可能なフィードバックを生成する新しい手法を提案する。
提案手法は,マルチモーダルな入力の組み合わせを解析し,フルスペクトルで実用的なコーチングを出力することができる。
論文 参考訳(メタデータ) (2024-08-01T16:13:07Z) - Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding [49.88140766026886]
状態空間モデルMambaは、長周期モデリングからビデオモデリングへの成功を拡大する有望な特性を示している。
我々は、マンバがビデオのモデリングにおいて様々な役割を担い、マンバが優位性を示す様々なタスクを調査しながら、包括的な研究を行う。
実験の結果,ビデオ専用タスクとビデオ言語タスクの両方において,Mambaの強い可能性を示すとともに,有望な効率と性能のトレードオフを示すことができた。
論文 参考訳(メタデータ) (2024-03-14T17:57:07Z) - Knowledge Guided Entity-aware Video Captioning and A Basketball
Benchmark [49.54265459763042]
バスケットボールゲーム知識グラフ(KG_NBA_2022)を構築し,ビデオ以外の知識を提供する。
そして、KG_NBA_2022に基づいて、9種類のきめ細かいシューティングイベントと286人のプレイヤーの知識を含むデータセットを構築する。
バスケットボールのライブテキスト放送のためのエンコーダデコーダ形式の候補選手リストに基づいて,知識ガイド付きエンティティ対応ビデオキャプションネットワーク(KEANet)を開発した。
論文 参考訳(メタデータ) (2024-01-25T02:08:37Z) - GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for
Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。
私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文 参考訳(メタデータ) (2023-03-26T08:43:36Z) - NBA2Vec: Dense feature representations of NBA players [0.0]
本稿では,各プレーヤの高密度特徴表現を抽出するWord2Vecに基づくニューラルネットワークモデルであるNBA2Vecを提案する。
NBA2Vecは、2017年のNBAプレイオフシリーズの結果を正確に予測する。
NBA2Vec埋め込みの今後の応用は、プレイヤーのスタイルを特徴付けることで、プレイヤーの獲得とコーチング決定のための予測モデルに革命をもたらす可能性がある。
論文 参考訳(メタデータ) (2023-02-26T19:05:57Z) - Can a face tell us anything about an NBA prospect? -- A Deep Learning
approach [0.0]
画像解析と畳み込みニューラルネットワークを,各ドラフトクラスから新たに作成した選手のキャリア軌跡を予測するために展開する。
1990年以降のドラフト毎に,約1500枚の画像データからなるデータベースを構築した。
筆者らは,データ中の一般的な事前学習画像分類モデルを訓練し,新人選手のキャリアを確実に予測するモデルを作成するために,一連の実験を行った。
論文 参考訳(メタデータ) (2022-12-13T18:36:29Z) - A Survey on Video Action Recognition in Sports: Datasets, Methods and
Applications [60.3327085463545]
本稿では,スポーツ分析のための映像行動認識に関する調査を行う。
サッカー、バスケットボール、バレーボール、ホッケー、フィギュアスケート、体操、卓球、ダイビング、バドミントンなど10種以上のスポーツを紹介します。
本研究では,サッカー,バスケットボール,卓球,フィギュアスケート動作認識をサポートするPaddlePaddleを用いたツールボックスを開発した。
論文 参考訳(メタデータ) (2022-06-02T13:19:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。