論文の概要: D$^{\bf{3}}$: Duplicate Detection Decontaminator for Multi-Athlete
Tracking in Sports Videos
- arxiv url: http://arxiv.org/abs/2209.12248v1
- Date: Sun, 25 Sep 2022 15:46:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 16:25:10.290369
- Title: D$^{\bf{3}}$: Duplicate Detection Decontaminator for Multi-Athlete
Tracking in Sports Videos
- Title(参考訳): d$^{\bf{3}}$:スポーツビデオにおけるマルチアトレー追跡のための重複検出除染器
- Authors: Rui He, Zehua Fu, Qingjie Liu, Yunhong Wang, Xunxun Chen
- Abstract要約: 重複検出は、1フレーム内の複数の検出ボックスによって、同一選手の閉塞誤報として、新しく正確に定義される。
この問題に対処するために、トレーニング用のトランスフォーマーベースの検出デコンタミネータ(D$3$)と、マッチングのための特定のアルゴリズムRally-Hungarian(RH)を慎重に設計する。
我々のモデルはバレーボールビデオのみで訓練されており、MATのバスケットボールやサッカービデオに直接適用することができる。
- 参考スコア(独自算出の注目度): 44.027619577289144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracking multiple athletes in sports videos is a very challenging
Multi-Object Tracking (MOT) task, since athletes often have the same appearance
and are intimately covered with each other, making a common occlusion problem
becomes an abhorrent duplicate detection. In this paper, the duplicate
detection is newly and precisely defined as occlusion misreporting on the same
athlete by multiple detection boxes in one frame. To address this problem, we
meticulously design a novel transformer-based Duplicate Detection
Decontaminator (D$^3$) for training, and a specific algorithm Rally-Hungarian
(RH) for matching. Once duplicate detection occurs, D$^3$ immediately modifies
the procedure by generating enhanced boxes losses. RH, triggered by the team
sports substitution rules, is exceedingly suitable for sports videos. Moreover,
to complement the tracking dataset that without shot changes, we release a new
dataset based on sports video named RallyTrack. Extensive experiments on
RallyTrack show that combining D$^3$ and RH can dramatically improve the
tracking performance with 9.2 in MOTA and 4.5 in HOTA. Meanwhile, experiments
on MOT-series and DanceTrack discover that D$^3$ can accelerate convergence
during training, especially save up to 80 percent of the original training time
on MOT17. Finally, our model, which is trained only with volleyball videos, can
be applied directly to basketball and soccer videos for MAT, which shows
priority of our method. Our dataset is available at
https://github.com/heruihr/rallytrack.
- Abstract(参考訳): スポーツビデオで複数のアスリートを追跡することは、多目的追跡(MOT: Multi-Object Tracking)タスクは非常に難しい。
本稿では,複数個の検出ボックスを1フレームに配置して,同一選手に対するオクルージョン誤報として,重複検出を新たに正確に定義する。
この問題に対処するために,新しいトランスフォーマーを用いたD$^3$のDuplicate Detection Decontaminatorと,マッチングのためのRally-Hungarian(RH)アルゴリズムを慎重に設計する。
重複検出が発生したら、d$^3$は強化されたボックスロスを生成して直ちに手順を変更する。
チームのスポーツ代替ルールによって引き起こされたRHは、スポーツビデオに非常に適している。
さらに,ショット変更のない追跡データセットを補完するために,スポーツビデオに基づく新たなデータセットであるrallytrackをリリースする。
RallyTrackの大規模な実験により、D$^3$とRHを組み合わせることで、MOTA 9.2、HOTA4.5のトラッキング性能が劇的に向上することが示された。
一方、MOTシリーズとDanceTrackの実験では、D$^3$はトレーニング中の収束を加速し、特にMOT17のトレーニング時間の最大80%を節約できることがわかった。
最後に,バレーボールビデオのみをトレーニングしたモデルを,MATのバスケットボールおよびサッカービデオに直接適用し,その方法の優先度を示す。
私たちのデータセットはhttps://github.com/heruihr/rallytrackで利用可能です。
関連論文リスト
- GTA: Global Tracklet Association for Multi-Object Tracking in Sports [28.771579713224085]
スポーツシナリオにおける多目的追跡は、コンピュータビジョンにおける焦点の1つとなっている。
トラッキング性能を向上させるために,外見に基づくグローバルトラックレットアソシエーションアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-12T22:16:50Z) - Temporal Correlation Meets Embedding: Towards a 2nd Generation of JDE-based Real-Time Multi-Object Tracking [52.04679257903805]
共同検出・埋め込み(JDE)トラッカーは多目的追跡(MOT)タスクにおいて優れた性能を示した。
TCBTrackという名前のトラッカーは、複数の公開ベンチマークで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-07-19T07:48:45Z) - SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports
Scenes [44.46768991505495]
本稿では,emphSportsMOTと呼ばれる多種多様なスポーツシーンにおける大規模多目的追跡データセットを提案する。
240のビデオシーケンス、150Kフレーム以上、およびバスケットボール、バレーボール、サッカーを含む3つのスポーツカテゴリーから収集された1.6M以上のバウンディングボックスで構成されている。
本稿では,emphMixSortと呼ばれる新しい多対象追跡フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-11T12:07:31Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - Unifying Tracking and Image-Video Object Detection [54.91658924277527]
TrIVD (Tracking and Image-Video Detection) は、画像OD、ビデオOD、MOTを1つのエンドツーエンドモデルに統合する最初のフレームワークである。
カテゴリラベルの相違やセマンティックな重複に対処するため、TrIVDは対象カテゴリに対する検出/追跡を基礎と理由として定式化している。
論文 参考訳(メタデータ) (2022-11-20T20:30:28Z) - P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos [64.57435509822416]
この作品は、ワールド・テーブルテニス選手権とオリンピアードのプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
強調局所化と強調認識という2つのアクション検出問題を定式化する。
その結果、TheNameは依然として困難なタスクであり、ビデオからの高密度なアクション検出のための特別なベンチマークとして使用できることを確認した。
論文 参考訳(メタデータ) (2022-07-26T08:34:17Z) - TDT: Teaching Detectors to Track without Fully Annotated Videos [2.8292841621378844]
検知と外観の埋め込みの両方を予測するワンステージトラッカーは、多くの注目を集めた。
提案した1段階のソリューションは,2段階のソリューションと品質が一致するが,3倍高速である。
論文 参考訳(メタデータ) (2022-05-11T15:56:17Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。