論文の概要: MatchTime: Towards Automatic Soccer Game Commentary Generation
- arxiv url: http://arxiv.org/abs/2406.18530v2
- Date: Mon, 18 Nov 2024 04:45:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:29:16.609145
- Title: MatchTime: Towards Automatic Soccer Game Commentary Generation
- Title(参考訳): MatchTime: 自動サッカーゲーム解説生成を目指す
- Authors: Jiayuan Rao, Haoning Wu, Chang Liu, Yanfeng Wang, Weidi Xie,
- Abstract要約: 観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
- 参考スコア(独自算出の注目度): 52.431010585268865
- License:
- Abstract: Soccer is a globally popular sport with a vast audience, in this paper, we consider constructing an automatic soccer game commentary model to improve the audiences' viewing experience. In general, we make the following contributions: First, observing the prevalent video-text misalignment in existing datasets, we manually annotate timestamps for 49 matches, establishing a more robust benchmark for soccer game commentary generation, termed as SN-Caption-test-align; Second, we propose a multi-modal temporal alignment pipeline to automatically correct and filter the existing dataset at scale, creating a higher-quality soccer game commentary dataset for training, denoted as MatchTime; Third, based on our curated dataset, we train an automatic commentary generation model, named MatchVoice. Extensive experiments and ablation studies have demonstrated the effectiveness of our alignment pipeline, and training model on the curated dataset achieves state-of-the-art performance for commentary generation, showcasing that better alignment can lead to significant performance improvements in downstream tasks.
- Abstract(参考訳): 本論文では,観客の視聴体験を改善するために,サッカーゲームの自動解説モデルの構築を検討する。
まず、既存のデータセットで広く使われているビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートし、SN-Caption-test-alignと呼ばれるサッカーゲームのコメント生成のためのより堅牢なベンチマークを確立します。
集約的な実験とアブレーション研究により、アライメントパイプラインの有効性が実証され、キュレートされたデータセットのトレーニングモデルは、注釈生成のための最先端のパフォーマンスを実現し、より優れたアライメントが下流タスクの大幅なパフォーマンス向上につながることを示した。
関連論文リスト
- A Simple and Effective Temporal Grounding Pipeline for Basketball Broadcast Footage [0.0]
バスケットボール放送映像の映像から分析的アライメントのための信頼性の高い時間的グラウンドパイプラインを提案する。
本手法は,ビデオフレームに高密度なイベントアノテーションを含むプレイバイプレイアノテーションのラベル付きコーパスを調整し,ラベル付きビデオセグメントの迅速な検索を可能にする。
論文 参考訳(メタデータ) (2024-10-30T17:27:44Z) - Going for GOAL: A Resource for Grounded Football Commentaries [66.10040637644697]
本稿では,GrOunded footbAlLコメンタリー(GOAL)について紹介する。
本稿では,フレームリオーダー,モーメント検索,ライブコメンタリー検索,プレイバイプレイのライブコメンタリー生成といったタスクに対して,最先端のベースラインを提供する。
その結果,ほとんどのタスクにおいてSOTAモデルは合理的に機能することがわかった。
論文 参考訳(メタデータ) (2022-11-08T20:04:27Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - Align and Prompt: Video-and-Language Pre-training with Entity Prompts [111.23364631136339]
ビデオと言語による事前トレーニングは、様々なダウンストリームタスクに有望な改善を示している。
Align and Prompt: クロスモーダルアライメントを改良した,効率的かつ効果的なビデオ・言語事前学習フレームワークを提案する。
私たちのコードと事前訓練されたモデルはリリースされます。
論文 参考訳(メタデータ) (2021-12-17T15:55:53Z) - Extraction of Positional Player Data from Broadcast Soccer Videos [3.7437974317872]
サッカーの試合の放送映像記録から位置データの完全自動抽出のためのパイプラインを提案する。
このシステムは、スポーツフィールド登録、プレーヤー検出、チーム割り当てなど、必要なすべてのサブタスクを統合している。
個々のモジュールとパイプライン全体の総合的な実験的評価が提示される。
論文 参考訳(メタデータ) (2021-10-21T12:49:56Z) - Temporally-Aware Feature Pooling for Action Spotting in Soccer
Broadcasts [86.56462654572813]
私たちは、サッカーの試合の主なアクションを一時的にローカライズするサッカー放送におけるアクションスポッティングの分析に焦点を当てています。
時間的知識を組み込んだNetVLAD++という,NetVLADに基づく新たな機能プーリング手法を提案する。
我々は最近の大規模データセット SoccerNet-v2 の方法論をトレーニングし、評価し、アクションスポッティングのための平均平均mAP 53.4% に達した。
論文 参考訳(メタデータ) (2021-04-14T11:09:03Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z) - Automatic Pass Annotation from Soccer VideoStreams Based on Object
Detection and LSTM [6.87782863484826]
PassNetは、サッカーで最も頻繁なイベント、すなわちパスをビデオストリームから認識する方法である。
その結果,パス検出の精度が向上し,良好な結果が得られた。
PassNetは自動イベントアノテーションシステムへの第一歩です。
論文 参考訳(メタデータ) (2020-07-13T16:14:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。