論文の概要: Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts
- arxiv url: http://arxiv.org/abs/2104.06779v1
- Date: Wed, 14 Apr 2021 11:09:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-15 13:16:08.279638
- Title: Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts
- Title(参考訳): サッカー放送におけるアクションスポッティングのための時間的特徴ポーリング
- Authors: Silvio Giancola, Bernard Ghanem
- Abstract要約: 私たちは、サッカーの試合の主なアクションを一時的にローカライズするサッカー放送におけるアクションスポッティングの分析に焦点を当てています。
時間的知識を組み込んだNetVLAD++という,NetVLADに基づく新たな機能プーリング手法を提案する。
我々は最近の大規模データセット SoccerNet-v2 の方法論をトレーニングし、評価し、アクションスポッティングのための平均平均mAP 53.4% に達した。
- 参考スコア(独自算出の注目度): 86.56462654572813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Toward the goal of automatic production for sports broadcasts, a paramount
task consists in understanding the high-level semantic information of the game
in play. For instance, recognizing and localizing the main actions of the game
would allow producers to adapt and automatize the broadcast production,
focusing on the important details of the game and maximizing the spectator
engagement. In this paper, we focus our analysis on action spotting in soccer
broadcast, which consists in temporally localizing the main actions in a soccer
game. To that end, we propose a novel feature pooling method based on NetVLAD,
dubbed NetVLAD++, that embeds temporally-aware knowledge. Different from
previous pooling methods that consider the temporal context as a single set to
pool from, we split the context before and after an action occurs. We argue
that considering the contextual information around the action spot as a single
entity leads to a sub-optimal learning for the pooling module. With NetVLAD++,
we disentangle the context from the past and future frames and learn specific
vocabularies of semantics for each subsets, avoiding to blend and blur such
vocabulary in time. Injecting such prior knowledge creates more informative
pooling modules and more discriminative pooled features, leading into a better
understanding of the actions. We train and evaluate our methodology on the
recent large-scale dataset SoccerNet-v2, reaching 53.4% Average-mAP for action
spotting, a +12.7% improvement w.r.t the current state-of-the-art.
- Abstract(参考訳): スポーツ放送の自動制作の目標に向けて、パラマウントタスクはプレイ中のゲームの高レベルな意味情報を理解することにある。
例えば、ゲームのメインアクションを認識してローカライズすることで、プロデューサーはゲームの重要部分に集中し、観客のエンゲージメントを最大化することで、放送プロダクションを適応し、自動化することができる。
本稿では,サッカー放送における行動スポッティングの分析に焦点をあて,サッカーゲームにおける主動作の時間的局所化について述べる。
そこで我々はNetVLAD++と呼ばれるNetVLADに基づく,時間的知識を組み込んだ新しい機能プーリング手法を提案する。
時間的コンテキストをプールする単一のセットと考える以前のプールメソッドとは異なり、アクションの前後でコンテキストを分割します。
我々は、アクションスポット周辺のコンテキスト情報を単一のエンティティとして考えると、プールモジュールの準最適学習につながると論じる。
NetVLAD++では、コンテキストを過去と将来のフレームから切り離し、各サブセットのセマンティクスの特定の語彙を学習します。
このような事前知識の注入は、より有益なプーリングモジュールとより識別的なプーリング機能を生み出し、アクションの理解を深める。
我々は、最近の大規模データセット SoccerNet-v2 で方法論をトレーニングし、評価し、アクションスポッティングで平均 53.4% に達し、現在の最先端技術では +12.7% 改善した。
関連論文リスト
- Deep learning for action spotting in association football videos [64.10841325879996]
SoccerNetイニシアチブは毎年の課題を組織し、世界中の参加者が最先端のパフォーマンスを達成するために競う。
本稿では,スポーツにおけるアクションスポッティングの歴史を,2018年の課題の創出から,現在の研究・スポーツ産業における役割まで遡る。
論文 参考訳(メタデータ) (2024-10-02T07:56:15Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Weakly Supervised Temporal Action Localization Through Learning Explicit
Subspaces for Action and Context [151.23835595907596]
ビデオレベルの監視のみの下で、アクションインスタンスの時間的開始と終了をローカライズする方法を学ぶ。
アクションとコンテキストそれぞれについて,2つの機能サブスペースを学習するフレームワークを提案する。
提案手法は3つのベンチマークで最先端のWS-TAL法より優れている。
論文 参考訳(メタデータ) (2021-03-30T08:26:53Z) - Improved Soccer Action Spotting using both Audio and Video Streams [3.4376560669160394]
本稿では,ディープニューラルネットワークアーキテクチャの様々な段階における音声と映像の情報の組み合わせについて検討する。
我々は、Big Five European Leaguesの500のサッカーゲームビデオの注釈付きイベントを含む、 SoccerNetベンチマークデータセットを使用した。
平均的平均精度(mAP)は,行動分類タスクが7.43%,行動スポッティングタスクが4.19%であった。
論文 参考訳(メタデータ) (2020-11-09T09:12:44Z) - Intra- and Inter-Action Understanding via Temporal Action Parsing [118.32912239230272]
本研究では,スポーツビデオにサブアクションの手動アノテーションを付加した新しいデータセットを構築し,その上に時間的行動解析を行う。
スポーツ活動は通常、複数のサブアクションから構成されており、このような時間構造に対する意識は、行動認識に有益であることを示す。
また,時間的解析手法を多数検討し,そのラベルを知らずにトレーニングデータからサブアクションをマイニングできる改良手法を考案した。
論文 参考訳(メタデータ) (2020-05-20T17:45:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。