論文の概要: Modern Deep Learning Approaches for Cricket Shot Classification: A Comprehensive Baseline Study
- arxiv url: http://arxiv.org/abs/2510.09187v1
- Date: Fri, 10 Oct 2025 09:32:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.600852
- Title: Modern Deep Learning Approaches for Cricket Shot Classification: A Comprehensive Baseline Study
- Title(参考訳): クリケットショット分類のための最新のディープラーニングアプローチ:総合的ベースライン研究
- Authors: Sungwoo Kang,
- Abstract要約: 本稿では,クリケットショット分類における7つの異なる深層学習手法を比較した,最初の総合的ベースライン研究を提案する。
我々は,従来のCNN-LSTMアーキテクチャ,アテンションベースモデル,ビジョントランスフォーマー,トランスファーラーニングアプローチ,モダンなEfficientNet-GRUの組み合わせを実装し,評価する。
我々の最新のSOTAアプローチは、効率の良いNet-B0とGRUベースの時間モデルを組み合わせることで、92.25%の精度を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cricket shot classification from video sequences remains a challenging problem in sports video analysis, requiring effective modeling of both spatial and temporal features. This paper presents the first comprehensive baseline study comparing seven different deep learning approaches across four distinct research paradigms for cricket shot classification. We implement and systematically evaluate traditional CNN-LSTM architectures, attention-based models, vision transformers, transfer learning approaches, and modern EfficientNet-GRU combinations on a unified benchmark. A critical finding of our study is the significant performance gap between claims in academic literature and practical implementation results. While previous papers reported accuracies of 96\% (Balaji LRCN), 99.2\% (IJERCSE), and 93\% (Sensors), our standardized re-implementations achieve 46.0\%, 55.6\%, and 57.7\% respectively. Our modern SOTA approach, combining EfficientNet-B0 with a GRU-based temporal model, achieves 92.25\% accuracy, demonstrating that substantial improvements are possible with modern architectures and systematic optimization. All implementations follow modern MLOps practices with PyTorch Lightning, providing a reproducible research platform that exposes the critical importance of standardized evaluation protocols in sports video analysis research.
- Abstract(参考訳): ビデオシーケンスからのクリケットショットの分類は、空間的特徴と時間的特徴の両方を効果的にモデル化する必要があるため、スポーツビデオ分析において難しい問題である。
本論文は,クリケットショット分類のための4つの異なる研究パラダイムを対象とした,7つの異なるディープラーニングアプローチを比較した最初の総合的ベースライン研究である。
我々は,従来のCNN-LSTMアーキテクチャ,アテンションベースモデル,ビジョントランスフォーマー,トランスファーラーニングアプローチ,現代的なネットワーク-GRUの組み合わせを統一ベンチマーク上で実装し,体系的に評価する。
本研究の重要な発見は,学術文献におけるクレームと実践的実装結果との顕著なパフォーマンスギャップである。
以前の論文では、96\%(バラジRCN)、99.2\%(IJERCSE)、93\%(センサー)の精度が報告されていたが、標準化された再実装はそれぞれ46.0\%、55.6\%、57.7\%であった。
我々の最新のSOTAアプローチは、効率の良いNet-B0とGRUベースの時間モデルを組み合わせることで、92.25\%の精度を実現し、現代のアーキテクチャと体系的な最適化で大幅な改善が可能であることを示す。
PyTorch Lightningは、スポーツビデオ分析研究における標準化された評価プロトコルの重要な重要性を明らかにする再現可能な研究プラットフォームを提供する。
関連論文リスト
- Data Augmentation for Time-Series Classification: An Extensive Empirical Study and Comprehensive Survey [4.030910640265943]
データ拡張(DA)は時系列分類(TSC)において重要なアプローチとなっている
TSCにおけるDAの現在の状況は、断片化された文献レビュー、誤った方法論上の課題、アクセス可能なユーザ指向ツールの不足に悩まされている。
本研究では,これらの課題に対して,TSCドメイン内のDA方法論の総合的な検討を通じて対処する。
論文 参考訳(メタデータ) (2023-10-16T04:49:51Z) - DiversiGATE: A Comprehensive Framework for Reliable Large Language
Models [2.616506436169964]
LLM検証のための多種多様な方法論を統合する統合フレームワークであるDiversiGATEを導入する。
本稿では,DiversiGATEフレームワークに準拠した新たなセルフラーナーモデルを提案する。
提案手法は従来のLLMよりも優れており,GSM8Kベンチマークでは54.8%から61.8%の改善が達成されている。
論文 参考訳(メタデータ) (2023-06-22T22:29:40Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - SLCA: Slow Learner with Classifier Alignment for Continual Learning on a
Pre-trained Model [73.80068155830708]
予備学習モデル(CLPM)を用いた連続学習のための広範囲な解析法を提案する。
Slow Learner with Alignment (SLCA) というシンプルなアプローチを提案する。
さまざまなシナリオにおいて、私たちの提案はCLPMの大幅な改善を提供します。
論文 参考訳(メタデータ) (2023-03-09T08:57:01Z) - Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。
すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。
各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文 参考訳(メタデータ) (2022-09-03T09:38:11Z) - Generalized Reinforcement Meta Learning for Few-Shot Optimization [3.7675996866306845]
本稿では, 汎用的かつ柔軟な強化学習(RL)に基づくメタラーニングフレームワークを提案する。
我々のフレームワークは簡単にネットワークアーキテクチャ検索に拡張できる。
論文 参考訳(メタデータ) (2020-05-04T03:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。