論文の概要: BoxingVI: A Multi-Modal Benchmark for Boxing Action Recognition and Localization
- arxiv url: http://arxiv.org/abs/2511.16524v1
- Date: Thu, 20 Nov 2025 16:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.724724
- Title: BoxingVI: A Multi-Modal Benchmark for Boxing Action Recognition and Localization
- Title(参考訳): BoxingVI: ボクシング行動認識とローカライゼーションのためのマルチモーダルベンチマーク
- Authors: Rahul Kumar, Vipul Baghel, Sudhanshu Singh, Bikash Kumar Badatya, Shivam Yadav, Babji Srinivasan, Ravi Hegde,
- Abstract要約: ボクシングにおけるパンチ検出と分類に適した、包括的でよく注釈付けされたビデオデータセットを提案する。
データセットは、6つの異なるパンチタイプに分類される6,915個の高品質なパンチクリップで構成されている。
この貢献は、ボクシングと関連ドメインにおける運動分析、自動コーチング、パフォーマンスアセスメントの進展を加速することを目的としている。
- 参考スコア(独自算出の注目度): 1.623267727687624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate analysis of combat sports using computer vision has gained traction in recent years, yet the development of robust datasets remains a major bottleneck due to the dynamic, unstructured nature of actions and variations in recording environments. In this work, we present a comprehensive, well-annotated video dataset tailored for punch detection and classification in boxing. The dataset comprises 6,915 high-quality punch clips categorized into six distinct punch types, extracted from 20 publicly available YouTube sparring sessions and involving 18 different athletes. Each clip is manually segmented and labeled to ensure precise temporal boundaries and class consistency, capturing a wide range of motion styles, camera angles, and athlete physiques. This dataset is specifically curated to support research in real-time vision-based action recognition, especially in low-resource and unconstrained environments. By providing a rich benchmark with diverse punch examples, this contribution aims to accelerate progress in movement analysis, automated coaching, and performance assessment within boxing and related domains.
- Abstract(参考訳): 近年、コンピュータビジョンを用いた戦闘スポーツの正確な分析が注目を集めているが、記録環境の動的で非構造的な性質と変動のために、頑健なデータセットの開発が大きなボトルネックとなっている。
本研究では,ボクシングにおけるパンチ検出と分類に適した包括的,注釈付きビデオデータセットを提案する。
データセットは、6つの異なるパンチタイプに分類される6,915個の高品質のパンチクリップで構成されており、20のYouTubeスパーリングセッションから抽出され、18の異なるアスリートが参加している。
それぞれのクリップは手動でセグメンテーションされ、正確な時間境界とクラス整合性を確保し、幅広い動きスタイル、カメラアングル、アスリートの体格をキャプチャする。
このデータセットは、特に低リソース環境と非制約環境において、リアルタイムな視覚に基づく行動認識の研究を支援するために特別にキュレーションされている。
このコントリビューションは、多様なパンチ例を備えたリッチなベンチマークを提供することで、動き分析、自動コーチング、およびボクシングと関連ドメインのパフォーマンス評価の進展を加速することを目的としている。
関連論文リスト
- BoxMAC -- A Boxing Dataset for Multi-label Action Classification [0.0]
BoxMACは15のプロボクサーと13のアクションラベルを備えた現実世界のボクシングデータセットである。
本稿では,画像とビデオの両方において,複数の動作を共同認識するための新しいアーキテクチャを提案する。
BoxMACはスポーツとしてのボクシングの発展のための貴重な資源として機能する。
論文 参考訳(メタデータ) (2024-12-24T06:20:01Z) - FACTS: Fine-Grained Action Classification for Tactical Sports [4.810476621219244]
フェンシングやボクシングのような速いペースで密着したスポーツにおけるきめ細かいアクションの分類は、固有の課題である。
我々は、生のビデオデータを直接処理する、きめ細かいアクション認識のための新しいアプローチであるFACTSを紹介する。
本研究は, トレーニング, パフォーマンス分析, スペクタエンゲージメントを向上し, 戦術スポーツにおける行動分類のための新しいベンチマークを設定した。
論文 参考訳(メタデータ) (2024-12-21T03:00:25Z) - ActionAtlas: A VideoQA Benchmark for Domain-specialized Action Recognition [111.32822459456793]
ActionAtlasは、様々なスポーツのショートビデオを含むビデオ質問応答ベンチマークである。
このデータセットには、56のスポーツで580のユニークなアクションを示す934の動画が含まれており、合計1896のアクションが選択できる。
我々は、このベンチマークでオープンでプロプライエタリな基礎モデルを評価し、最高のモデルであるGPT-4oが45.52%の精度を達成することを発見した。
論文 参考訳(メタデータ) (2024-10-08T07:55:09Z) - Deep learning for action spotting in association football videos [64.10841325879996]
SoccerNetイニシアチブは毎年の課題を組織し、世界中の参加者が最先端のパフォーマンスを達成するために競う。
本稿では,スポーツにおけるアクションスポッティングの歴史を,2018年の課題の創出から,現在の研究・スポーツ産業における役割まで遡る。
論文 参考訳(メタデータ) (2024-10-02T07:56:15Z) - Benchmarking Badminton Action Recognition with a New Fine-Grained Dataset [16.407837909069073]
高品質なバドミントン映像から得られたビデオバドミントンデータセットを紹介する。
VideoBadmintonの導入は、バドミントンアクション認識だけでなく、きめ細かいアクションを認識するためのデータセットも提供する。
論文 参考訳(メタデータ) (2024-03-19T02:52:06Z) - Hybrid Dynamic-static Context-aware Attention Network for Action
Assessment in Long Videos [96.45804577283563]
本稿では,長期ビデオにおけるアクションアセスメントのための新しいハイブリットDynAmic-static Context-aware AttenTION NETwork(ACTION-NET)を提案する。
ビデオのダイナミックな情報を学習すると同時に,特定フレームにおける検出した選手の静的姿勢にも焦点をあてる。
2つのストリームの特徴を組み合わせることで、専門家が与えた地道的なスコアによって監督され、最終的なビデオスコアを後退させます。
論文 参考訳(メタデータ) (2020-08-13T15:51:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。