論文の概要: Survey of Action Recognition, Spotting and Spatio-Temporal Localization
in Soccer -- Current Trends and Research Perspectives
- arxiv url: http://arxiv.org/abs/2309.12067v1
- Date: Thu, 21 Sep 2023 13:36:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-22 15:09:46.566903
- Title: Survey of Action Recognition, Spotting and Spatio-Temporal Localization
in Soccer -- Current Trends and Research Perspectives
- Title(参考訳): サッカーにおける行動認識・スポッティング・時空間局在調査の現状と研究動向
- Authors: Karolina Seweryn, Anna Wr\'oblewska, Szymon {\L}ukasik
- Abstract要約: サッカーにおけるアクションシーンの理解は、ゲームの複雑でダイナミックな性質のために難しい課題である。
この記事では、ディープラーニング技術と従来の手法を活用した最新の最先端の手法についてレビューする。
マルチモーダル法は、ビデオやオーディオデータなどの複数のソースからの情報を統合し、また、様々な方法で一つのソースを表すものも統合する。
- 参考スコア(独自算出の注目度): 0.7673339435080445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Action scene understanding in soccer is a challenging task due to the complex
and dynamic nature of the game, as well as the interactions between players.
This article provides a comprehensive overview of this task divided into action
recognition, spotting, and spatio-temporal action localization, with a
particular emphasis on the modalities used and multimodal methods. We explore
the publicly available data sources and metrics used to evaluate models'
performance. The article reviews recent state-of-the-art methods that leverage
deep learning techniques and traditional methods. We focus on multimodal
methods, which integrate information from multiple sources, such as video and
audio data, and also those that represent one source in various ways. The
advantages and limitations of methods are discussed, along with their potential
for improving the accuracy and robustness of models. Finally, the article
highlights some of the open research questions and future directions in the
field of soccer action recognition, including the potential for multimodal
methods to advance this field. Overall, this survey provides a valuable
resource for researchers interested in the field of action scene understanding
in soccer.
- Abstract(参考訳): サッカーにおけるアクションシーンの理解は、ゲームの複雑でダイナミックな性質とプレイヤー間の相互作用のために難しい課題である。
本稿では,この課題の包括的概要を,行動認識,スポッティング,時空間的行動定位に分類した。
モデルの性能を評価するために使用される,公開データソースとメトリクスについて検討する。
この記事では、ディープラーニング技術と従来の手法を活用する最先端の手法についてレビューする。
ビデオやオーディオデータなどの複数のソースからの情報を統合したマルチモーダル手法や,ひとつのソースをさまざまな方法で表現する手法に注目する。
モデルの精度と堅牢性を改善する可能性とともに、手法の利点と限界について議論する。
最後に,サッカーのアクション認識分野におけるオープンな研究課題と今後の方向性に注目し,その分野を前進させるマルチモーダル手法の可能性について述べる。
全体として、この調査はサッカーにおけるアクションシーン理解の分野に関心を持つ研究者に貴重なリソースを提供する。
関連論文リスト
- Survey on Knowledge Distillation for Large Language Models: Methods, Evaluation, and Application [21.555902498178387]
大規模言語モデル(LLM)は様々な領域で例外的な機能を示しており、学術と産業の両方から大きな関心を集めている。
精度を維持しながら言語モデルを圧縮する努力は研究の焦点となっている。
知識蒸留は、性能を著しく損なうことなく推論速度を向上する有効な手法として登場した。
論文 参考訳(メタデータ) (2024-07-02T02:14:42Z) - OSL-ActionSpotting: A Unified Library for Action Spotting in Sports Videos [56.393522913188704]
我々は,スポーツビデオ分析における研究と応用の合理化のために,さまざまなアクションスポッティングアルゴリズムを統合するPythonライブラリであるOSL-ActionSpottingを紹介する。
我々はOSL-ActionSpottingに3つの基本アクションスポッティング手法を統合することに成功した。
論文 参考訳(メタデータ) (2024-07-01T13:17:37Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object
Detection [72.36017150922504]
教師の融合変換器から学生検出器へ学習した文脈知識を伝達するためのマルチモーダルな文脈知識蒸留フレームワーク MMC-Det を提案する。
多様なマルチモーダルマスキング言語モデリングは、従来のマルチモーダルマスキング言語モデリング(MLM)に基づくオブジェクト分散制約により実現される。
論文 参考訳(メタデータ) (2023-08-30T08:33:13Z) - A Multi-stage deep architecture for summary generation of soccer videos [11.41978608521222]
本稿では,音声メタデータとイベントメタデータの両方を利用して,サッカーの試合の要約を生成する手法を提案する。
その結果,提案手法は一致の動作を検出し,どの動作が要約に属するべきかを識別し,複数の候補要約を提案する。
論文 参考訳(メタデータ) (2022-05-02T07:26:35Z) - Continuous Human Action Recognition for Human-Machine Interaction: A
Review [39.593687054839265]
入力ビデオ内のアクションを認識することは難しいが、リアルタイムの人間と機械のインタラクションを必要とするアプリケーションに必要なタスクである。
我々は,ほとんどの最先端手法で使用される特徴抽出と学習戦略について述べる。
実世界のシナリオへのそのようなモデルの適用について検討し、いくつかの制限と研究の方向性について論じる。
論文 参考訳(メタデータ) (2022-02-26T09:25:44Z) - An overview of event extraction and its applications [1.8047694351309205]
本研究では,現在最先端のイベント抽出手法とそのテキストからの応用について概説する。
この調査の特徴は、適度な複雑さの概観を提供し、特定のアプローチの詳細が多すぎることを避けることである。
論文 参考訳(メタデータ) (2021-11-05T01:37:47Z) - Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts [86.56462654572813]
私たちは、サッカーの試合の主なアクションを一時的にローカライズするサッカー放送におけるアクションスポッティングの分析に焦点を当てています。
時間的知識を組み込んだNetVLAD++という,NetVLADに基づく新たな機能プーリング手法を提案する。
我々は最近の大規模データセット SoccerNet-v2 の方法論をトレーニングし、評価し、アクションスポッティングのための平均平均mAP 53.4% に達した。
論文 参考訳(メタデータ) (2021-04-14T11:09:03Z) - From Handcrafted to Deep Features for Pedestrian Detection: A Survey [148.35460817092908]
歩行者検出はコンピュータビジョンにおいて重要であるが難しい問題である。
過去10年間で、手作りの機能と深い機能によって、大幅な改善が見られた。
単スペクトル歩行者検出に加えて,多スペクトル歩行者検出も検討した。
論文 参考訳(メタデータ) (2020-10-01T14:51:10Z) - Intra- and Inter-Action Understanding via Temporal Action Parsing [118.32912239230272]
本研究では,スポーツビデオにサブアクションの手動アノテーションを付加した新しいデータセットを構築し,その上に時間的行動解析を行う。
スポーツ活動は通常、複数のサブアクションから構成されており、このような時間構造に対する意識は、行動認識に有益であることを示す。
また,時間的解析手法を多数検討し,そのラベルを知らずにトレーニングデータからサブアクションをマイニングできる改良手法を考案した。
論文 参考訳(メタデータ) (2020-05-20T17:45:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。