論文の概要: A Unified Taxonomy and Multimodal Dataset for Events in Invasion Games
- arxiv url: http://arxiv.org/abs/2108.11149v2
- Date: Thu, 26 Aug 2021 11:18:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-27 10:52:20.088348
- Title: A Unified Taxonomy and Multimodal Dataset for Events in Invasion Games
- Title(参考訳): 侵略ゲームにおけるイベントの統一分類とマルチモーダルデータセット
- Authors: Henrik Biermann, Jonas Theiner, Manuel Bassek, Dominik Raabe, Daniel
Memmert, Ralph Ewerth
- Abstract要約: 本稿では,侵略ゲームにおける多種多様な低レベル・高レベルの事象を包括する普遍的な分類法を提案する。
我々は、細粒度および球中心イベントスポッティングの研究を促進するため、金標準アノテーションを用いたビデオデータと位置データからなる2つのマルチモーダルデータセットをリリースする。
- 参考スコア(独自算出の注目度): 3.7111751305143654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automatic detection of events in complex sports games like soccer and
handball using positional or video data is of large interest in research and
industry. One requirement is a fundamental understanding of underlying
concepts, i.e., events that occur on the pitch. Previous work often deals only
with so-called low-level events based on well-defined rules such as free kicks,
free throws, or goals. High-level events, such as passes, are less frequently
approached due to a lack of consistent definitions. This introduces a level of
ambiguity that necessities careful validation when regarding event annotations.
Yet, this validation step is usually neglected as the majority of studies adopt
annotations from commercial providers on private datasets of unknown quality
and focuses on soccer only. To address these issues, we present (1) a universal
taxonomy that covers a wide range of low and high-level events for invasion
games and is exemplarily refined to soccer and handball, and (2) release two
multi-modal datasets comprising video and positional data with gold-standard
annotations to foster research in fine-grained and ball-centered event
spotting. Experiments on human performance demonstrate the robustness of the
proposed taxonomy, and that disagreements and ambiguities in the annotation
increase with the complexity of the event. An I3D model for video
classification is adopted for event spotting and reveals the potential for
benchmarking. Datasets are available at: https://github.com/mm4spa/eigd
- Abstract(参考訳): サッカーやハンドボールといった複雑なスポーツゲームにおける位置データやビデオデータによるイベントの自動検出は、研究や産業に大きな関心を寄せている。
1つの要件は、基本的な概念、すなわちピッチで起こるイベントの基本的な理解である。
以前の作業では、フリーキック、フリースロー、ゴールなど、明確に定義されたルールに基づいたいわゆる低レベルのイベントのみを扱うことが多い。
パスのような高レベルのイベントは、一貫した定義が欠如しているため、頻繁にアプローチされる。
これは、イベントアノテーションに関して慎重に検証する必要がある曖昧さのレベルを導入する。
しかし、ほとんどの研究は、未知の品質のプライベートデータセットに関する商用提供者からのアノテーションを採用し、サッカーのみに焦点を当てているため、この検証手順は無視される。
これらの問題に対処するために,(1)侵略ゲームのための幅広い低レベル・高レベルのイベントをカバーし,例えばサッカーやハンドボールに洗練されている普遍的分類法,(2)細粒度・球中心のイベントスポッティングの研究を促進するために,金標準アノテーション付きビデオと位置データからなる2つのマルチモーダルデータセットをリリースする。
人間のパフォーマンス実験では,提案する分類法の頑健性が示され,アノテーションにおける不一致やあいまいさは,イベントの複雑さとともに増大する。
イベントスポッティングにビデオ分類のためのI3Dモデルを採用し、ベンチマークの可能性を明らかにする。
データセットは、https://github.com/mm4spa/eigd.comで入手できる。
関連論文リスト
- Generating Event-oriented Attribution for Movies via Two-Stage Prefix-Enhanced Multimodal LLM [47.786978666537436]
本稿では,2段階の事前修正強化MLLM (TSPE) アプローチを提案する。
局所的な段階では、1つのクリップ内の関連するマルチモーダル情報にフォーカスするようモデルに誘導する対話対応プレフィックスを導入する。
グローバルな段階では、推論知識グラフを用いて関連するイベント間の接続を強化する。
論文 参考訳(メタデータ) (2024-09-14T08:30:59Z) - Improving Event Definition Following For Zero-Shot Event Detection [66.27883872707523]
ゼロショットイベント検出に対する既存のアプローチは通常、既知のイベントタイプをアノテートしたデータセット上でモデルをトレーニングする。
イベント定義に従うためのトレーニングモデルによるゼロショットイベント検出の改善を目指しています。
論文 参考訳(メタデータ) (2024-03-05T01:46:50Z) - A Graph-Based Method for Soccer Action Spotting Using Unsupervised
Player Classification [75.93186954061943]
アクションスポッティングには、ゲームのダイナミクス、イベントの複雑さ、ビデオシーケンスのバリエーションを理解することが含まれる。
本研究では, (a) 選手, 審判, ゴールキーパーをグラフのノードとして識別し, および (b) 時間的相互作用をグラフのシーケンスとしてモデル化することによって, 前者に焦点を当てる。
プレーヤ識別タスクでは,他のモダリティと組み合わせることで,平均mAPの57.83%の総合的な性能が得られる。
論文 参考訳(メタデータ) (2022-11-22T15:23:53Z) - Unifying Event Detection and Captioning as Sequence Generation via
Pre-Training [53.613265415703815]
本稿では,イベント検出とキャプションのタスク間関連性を高めるための,事前学習と微調整の統合フレームワークを提案する。
我々のモデルは最先端の手法よりも優れており、大規模ビデオテキストデータによる事前学習ではさらに向上できる。
論文 参考訳(メタデータ) (2022-07-18T14:18:13Z) - PILED: An Identify-and-Localize Framework for Few-Shot Event Detection [79.66042333016478]
本研究では,事前学習した言語モデルから事象関連知識を引き出すために,クローゼプロンプトを用いた。
型固有のパラメータの数を最小化し、新しい型に対するイベント検出タスクに迅速に適応できるようにします。
論文 参考訳(メタデータ) (2022-02-15T18:01:39Z) - MultiSports: A Multi-Person Video Dataset of Spatio-Temporally Localized
Sports Actions [39.27858380391081]
本論文では、マルチスポーツとして作成された原子時間行動の新しいマルチパーソンデータセットを提示する。
4つのスポーツクラスを選択し、約3200のビデオクリップを収集し、37790のアクションインスタンスに907kバウンディングボックスをアノテートすることで、MultiSports v1.0のデータセットを構築します。
論文 参考訳(メタデータ) (2021-05-16T10:40:30Z) - RMS-Net: Regression and Masking for Soccer Event Spotting [52.742046866220484]
イベントラベルとその時間的オフセットを同時に予測できる,軽量でモジュール化されたアクションスポッティングネットワークを開発した。
SoccerNetデータセットでテストし、標準機能を使用して、完全な提案は3平均mAPポイントで現在の状態を超えます。
論文 参考訳(メタデータ) (2021-02-15T16:04:18Z) - Automatic Pass Annotation from Soccer VideoStreams Based on Object
Detection and LSTM [6.87782863484826]
PassNetは、サッカーで最も頻繁なイベント、すなわちパスをビデオストリームから認識する方法である。
その結果,パス検出の精度が向上し,良好な結果が得られた。
PassNetは自動イベントアノテーションシステムへの第一歩です。
論文 参考訳(メタデータ) (2020-07-13T16:14:41Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。