論文の概要: Widely Applicable Strong Baseline for Sports Ball Detection and Tracking
- arxiv url: http://arxiv.org/abs/2311.05237v1
- Date: Thu, 9 Nov 2023 09:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-10 15:40:28.922447
- Title: Widely Applicable Strong Baseline for Sports Ball Detection and Tracking
- Title(参考訳): スポーツボール検出・追跡のための広く適用可能な強基線
- Authors: Shuhei Tarashima, Muhammad Abdul Haq, Yushan Wang, Norio Tagawa
- Abstract要約: 本稿では,各種スポーツカテゴリーに適用可能な新しいスポーツボール検出・追跡手法を提案する。
提案手法は,(1)高分解能特徴抽出,(2)位置認識モデルトレーニング,(3)時間的整合性を考慮した推論からなる。
- 参考スコア(独自算出の注目度): 0.9831489366502302
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present a novel Sports Ball Detection and Tracking (SBDT)
method that can be applied to various sports categories. Our approach is
composed of (1) high-resolution feature extraction, (2) position-aware model
training, and (3) inference considering temporal consistency, all of which are
put together as a new SBDT baseline. Besides, to validate the
wide-applicability of our approach, we compare our baseline with 6
state-of-the-art SBDT methods on 5 datasets from different sports categories.
We achieve this by newly introducing two SBDT datasets, providing new ball
annotations for two datasets, and re-implementing all the methods to ease
extensive comparison. Experimental results demonstrate that our approach is
substantially superior to existing methods on all the sports categories covered
by the datasets. We believe our proposed method can play as a Widely Applicable
Strong Baseline (WASB) of SBDT, and our datasets and codebase will promote
future SBDT research. Datasets and codes will be made publicly available.
- Abstract(参考訳): 本稿では,様々なスポーツカテゴリに適用可能な新しいスポーツボール検出追跡法(sbdt)を提案する。
提案手法は,(1)高分解能特徴抽出,(2)位置認識モデルトレーニング,(3)時間的一貫性を考慮した推論から成り,これらすべてを新しいSBDTベースラインとしてまとめる。
さらに,本手法の適用性を検証するため,スポーツカテゴリーの5つのデータセットに対して,ベースラインを6つの最先端SBDT法と比較した。
2つのSBDTデータセットを新たに導入し、2つのデータセットに対して新しいボールアノテーションを提供し、拡張比較を容易にするためにすべてのメソッドを再実装することで、これを実現する。
実験の結果,本手法は,データセットでカバーされたすべてのスポーツカテゴリにおいて,既存の手法よりも大幅に優れていることがわかった。
提案手法はSBDTの広範適用性強いベースライン(WASB)として機能し,我々のデータセットとコードベースは将来のSBDT研究を促進するだろうと考えている。
データセットとコードは公開される予定だ。
関連論文リスト
- DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection [72.25697820290502]
この研究は、ゼロショット分類によって潜在的に新しいクラスを特定するための単純かつ効率的な戦略を導入する。
このアプローチは、アノテーションやデータセット、再学習を必要とせずに、新しいクラスのリコールと精度を高めるセルフトレーニング戦略として言及する。
LVIS、V3Det、COCOを含む3つのデータセットに対する実証的な評価は、ベースラインのパフォーマンスを大幅に改善したことを示している。
論文 参考訳(メタデータ) (2023-10-02T17:52:24Z) - Optimizing Multi-Domain Performance with Active Learning-based
Improvement Strategies [1.03905835096574]
複数のドメインにわたるパフォーマンス向上のための,アクティブな学習ベースのフレームワークを提案する。
まず、ベースモデルをトレーニングするためにラベル付きデータの初期セットを使用し、次にラベル付けのための最も情報性の高いサンプルを反復的に選択し、モデルを洗練させます。
論文 参考訳(メタデータ) (2023-04-13T05:27:43Z) - Image Classification with Small Datasets: Overview and Benchmark [0.0]
私たちは過去の研究を体系的に組織化し、結合し、現在分断され散らばっているコミュニティを統合する。
本稿では,アプローチの客観的比較を可能にする共通ベンチマークを提案する。
このベンチマークを用いて、標準のクロスエントロピーベースラインと、有名な会場で2017年から2021年にかけて発行された10の既存手法を再評価する。
論文 参考訳(メタデータ) (2022-12-23T17:11:16Z) - Tackling Long-Tailed Category Distribution Under Domain Shifts [50.21255304847395]
既存のアプローチでは、両方の問題が存在するシナリオに対処できません。
本研究では,分散校正型分類損失,視覚意味マッピング,セマンティック類似性誘導拡張の3つの新しい機能ブロックを設計した。
AWA2-LTSとImageNet-LTSという2つの新しいデータセットが提案された。
論文 参考訳(メタデータ) (2022-07-20T19:07:46Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - All Birds with One Stone: Multi-task Text Classification for Efficient
Inference with One Forward Pass [34.85886030306857]
Webコンテンツ分類では、Web記事のような同じ入力テキストから複数の分類タスクを予測する。
既存のマルチタスクトランスモデルは、O(N)コストでNタスクに対してNフォワードパスを実行する必要がある。
本稿では,O(1)計算コストを1つのフォワードパスのみに設定することで,高い性能を実現するスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2022-05-22T05:16:03Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - TDT: Teaching Detectors to Track without Fully Annotated Videos [2.8292841621378844]
検知と外観の埋め込みの両方を予測するワンステージトラッカーは、多くの注目を集めた。
提案した1段階のソリューションは,2段階のソリューションと品質が一致するが,3倍高速である。
論文 参考訳(メタデータ) (2022-05-11T15:56:17Z) - A Comparative Survey of Deep Active Learning [76.04825433362709]
Active Learning (AL)は、ラベル付けのための大きなラベル付けされていないデータプールからデータサンプルを順次選択することで、ラベル付けコストを削減するための一連のテクニックである。
ディープラーニング(DL)はデータハングリーであり、DLモデルのパフォーマンスは、より多くのトレーニングデータとともに単調にスケールする。
近年、Deep Active Learning (DAL) は、高価なラベリングコストを最小化しつつ、モデル性能を最大化するための実現可能なソリューションとして上昇している。
論文 参考訳(メタデータ) (2022-03-25T05:17:24Z) - MDMMT: Multidomain Multimodal Transformer for Video Retrieval [63.872634680339644]
MSRVTTおよびLSMDCベンチマークのテキストからビデオ検索タスクに新しい最新技術を紹介します。
異なるデータセットでのトレーニングは、互いにテスト結果を改善することができることを示す。
論文 参考訳(メタデータ) (2021-03-19T09:16:39Z) - Hierarchical Action Classification with Network Pruning [1.827510863075184]
本稿では,階層分類,ネットワークプルーニング,スケルトンに基づく前処理など,補助的な機構の活用について述べる。
本手法の有効性を4つのテストデータセットで検証する。
論文 参考訳(メタデータ) (2020-07-30T05:49:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。