論文の概要: RMS-Net: Regression and Masking for Soccer Event Spotting
- arxiv url: http://arxiv.org/abs/2102.07624v1
- Date: Mon, 15 Feb 2021 16:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:43:13.892033
- Title: RMS-Net: Regression and Masking for Soccer Event Spotting
- Title(参考訳): RMS-Net: サッカーイベントスポッティングの回帰とマスキング
- Authors: Matteo Tomei, Lorenzo Baraldi, Simone Calderara, Simone Bronzin, Rita
Cucchiara
- Abstract要約: イベントラベルとその時間的オフセットを同時に予測できる,軽量でモジュール化されたアクションスポッティングネットワークを開発した。
SoccerNetデータセットでテストし、標準機能を使用して、完全な提案は3平均mAPポイントで現在の状態を超えます。
- 参考スコア(独自算出の注目度): 52.742046866220484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recently proposed action spotting task consists in finding the exact
timestamp in which an event occurs. This task fits particularly well for soccer
videos, where events correspond to salient actions strictly defined by soccer
rules (a goal occurs when the ball crosses the goal line). In this paper, we
devise a lightweight and modular network for action spotting, which can
simultaneously predict the event label and its temporal offset using the same
underlying features. We enrich our model with two training strategies: the
first one for data balancing and uniform sampling, the second for masking
ambiguous frames and keeping the most discriminative visual cues. When tested
on the SoccerNet dataset and using standard features, our full proposal exceeds
the current state of the art by 3 Average-mAP points. Additionally, it reaches
a gain of more than 10 Average-mAP points on the test set when fine-tuned in
combination with a strong 2D backbone.
- Abstract(参考訳): 最近提案されたアクションスポッティングタスクは、イベントが発生する正確なタイムスタンプを見つけることである。
このタスクはサッカービデオに特に適しており、イベントはサッカールールによって厳密に定義された健全なアクションに対応する(ゴールはボールがゴールラインを越えたときに起こる)。
本稿では,アクションスポッティングのための軽量でモジュール化されたネットワークを考案し,同じ基盤機能を用いてイベントラベルとテンポラリオフセットを同時に予測する。
データバランシングと均一サンプリングのための第1、曖昧なフレームをマスキングする第2、最も差別的な視覚的手がかりを維持するための第2の2つのトレーニング戦略で、当社のモデルを充実させています。
SoccerNetデータセットでテストし、標準機能を使用して、完全な提案は3平均mAPポイントで現在の状態を超えます。
さらに、強力な2Dバックボーンと組み合わせて微調整された場合、テストセット上で平均mAPポイントが10以上に達する。
関連論文リスト
- Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - Dual Memory Aggregation Network for Event-Based Object Detection with
Learnable Representation [79.02808071245634]
イベントベースのカメラはバイオインスパイアされたセンサーで、各ピクセルの明るさ変化を非同期に捉える。
イベントストリームは、正極性と負極性の両方のためにx-y-t座標の格子に分割され、3次元テンソル表現として柱の集合が生成される。
長メモリは適応型convLSTMの隠れ状態に符号化され、短メモリはイベントピラー間の空間的時間的相関を計算することによってモデル化される。
論文 参考訳(メタデータ) (2023-03-17T12:12:41Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Spotting Temporally Precise, Fine-Grained Events in Video [23.731838969934206]
ビデオ中に時間的に正確できめ細かなイベントを見つけるタスクを導入する。
モデルは、フルタイムのアクションスケールについてグローバルに推論し、微妙なフレーム間の外観と動きの違いを特定するために、ローカルで行う必要がある。
E2E-Spotは、精密なスポッティングタスクでよく機能し、1つのGPUで迅速にトレーニングできる、コンパクトでエンドツーエンドのモデルである。
論文 参考訳(メタデータ) (2022-07-20T22:15:07Z) - Temporally Precise Action Spotting in Soccer Videos Using Dense
Detection Anchors [1.6114012813668934]
本稿では,ビデオ中の時間的高精度な動作スポッティングのモデルを提案する。このモデルでは,検出アンカーの集合を用いて,検出信頼度と各アンカーの微細な時間的変位を推定する。
我々は,このタイプのサッカービデオデータセットとしては最大であり,時間的ローカライゼーションの大幅な向上を図っている。
論文 参考訳(メタデータ) (2022-05-20T22:14:02Z) - Bridging the Gap between Events and Frames through Unsupervised Domain
Adaptation [57.22705137545853]
本稿では,ラベル付き画像とラベル付きイベントデータを用いてモデルを直接訓練するタスク転送手法を提案する。
生成イベントモデルを利用して、イベント機能をコンテンツとモーションに分割します。
われわれのアプローチは、イベントベースのニューラルネットワークのトレーニングのために、膨大な量の既存の画像データセットをアンロックする。
論文 参考訳(メタデータ) (2021-09-06T17:31:37Z) - A Unified Taxonomy and Multimodal Dataset for Events in Invasion Games [3.7111751305143654]
本稿では,侵略ゲームにおける多種多様な低レベル・高レベルの事象を包括する普遍的な分類法を提案する。
我々は、細粒度および球中心イベントスポッティングの研究を促進するため、金標準アノテーションを用いたビデオデータと位置データからなる2つのマルチモーダルデータセットをリリースする。
論文 参考訳(メタデータ) (2021-08-25T10:09:28Z) - Dense Scene Multiple Object Tracking with Box-Plane Matching [73.54369833671772]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要なタスクである。
密集したシーンにおけるMOT性能を改善するために,Box-Plane Matching (BPM)法を提案する。
3つのモジュールの有効性により、ACM MM Grand Challenge HiEve 2020において、私たちのチームはトラック1のリーダーボードで1位を獲得しました。
論文 参考訳(メタデータ) (2020-07-30T16:39:22Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。