論文の概要: Large Scale Generative AI Text Applied to Sports and Music
- arxiv url: http://arxiv.org/abs/2402.15514v2
- Date: Wed, 28 Feb 2024 00:03:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 17:33:02.065531
- Title: Large Scale Generative AI Text Applied to Sports and Music
- Title(参考訳): スポーツ・音楽に適用した大規模生成aiテキスト
- Authors: Aaron Baughman, Stephen Hammer, Rahul Agarwal, Gozde Akay, Eduardo
Morales, Tony Johnson, Leonid Karlinsky, Rogerio Feris
- Abstract要約: 我々は,2023年USオープン,ウィンブルドン,マスターズトーナメントのハイライトパッケージに自動ナレーションを生成するAIコメンタリーシステムを導入する。
同じやり方で、私たちのソリューションはESPN Fantasy Footballのためのパーソナライズされたコンテンツと、グラミー賞の音楽アーティストに関するストーリーを作成するために拡張されました。
これらのアプリケーションは一般的なソフトウェアアーキテクチャを使用して構築され、平均ルージュ-Lは82.00、パープレキシティは6.6で15倍の速度向上を実現した。
- 参考スコア(独自算出の注目度): 12.046275277856733
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We address the problem of scaling up the production of media content,
including commentary and personalized news stories, for large-scale sports and
music events worldwide. Our approach relies on generative AI models to
transform a large volume of multimodal data (e.g., videos, articles, real-time
scoring feeds, statistics, and fact sheets) into coherent and fluent text.
Based on this approach, we introduce, for the first time, an AI commentary
system, which was deployed to produce automated narrations for highlight
packages at the 2023 US Open, Wimbledon, and Masters tournaments. In the same
vein, our solution was extended to create personalized content for ESPN Fantasy
Football and stories about music artists for the Grammy awards. These
applications were built using a common software architecture achieved a 15x
speed improvement with an average Rouge-L of 82.00 and perplexity of 6.6. Our
work was successfully deployed at the aforementioned events, supporting 90
million fans around the world with 8 billion page views, continuously pushing
the bounds on what is possible at the intersection of sports, entertainment,
and AI.
- Abstract(参考訳): 我々は、世界中の大規模スポーツや音楽イベントのために、コメントやパーソナライズされたニュース記事を含むメディアコンテンツの生産を拡大する問題に対処する。
私たちのアプローチは、生成AIモデルを使用して、大量のマルチモーダルデータ(ビデオ、記事、リアルタイムスコアリングフィード、統計、ファクトシートなど)をコヒーレントで流動的なテキストに変換する。
このアプローチに基づいて,2023年のusオープン,ウィンブルドン,マスターズトーナメントにおいて,ハイライトパッケージのための自動ナレーションを生成するためにデプロイされたai解説システムについて紹介する。
同じ流れで、私たちのソリューションは、espnファンタジーフットボールのパーソナライズされたコンテンツと、グラミー賞の音楽アーティストに関するストーリーを作成するために拡張されました。
これらのアプリケーションは共通のソフトウェアアーキテクチャを使用して構築され、平均ルージュ-Lは82.00、パープレキシティは6.6で15倍の速度向上を達成した。
私たちの仕事は、前述のイベントでうまく展開され、世界中の9000万人のファンを80億ページビューでサポートし、スポーツ、エンターテイメント、AIの交差点で何ができるかを継続的に押し付けました。
関連論文リスト
- Deep learning for action spotting in association football videos [64.10841325879996]
SoccerNetイニシアチブは毎年の課題を組織し、世界中の参加者が最先端のパフォーマンスを達成するために競う。
本稿では,スポーツにおけるアクションスポッティングの歴史を,2018年の課題の創出から,現在の研究・スポーツ産業における役割まで遡る。
論文 参考訳(メタデータ) (2024-10-02T07:56:15Z) - MatchTime: Towards Automatic Soccer Game Commentary Generation [52.431010585268865]
観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
論文 参考訳(メタデータ) (2024-06-26T17:57:25Z) - SoccerNet-Echoes: A Soccer Game Audio Commentary Dataset [46.60191376520379]
本稿では,サッカーゲーム放送からの音声コメントの自動書き起こしによる,サッカーネットデータセットの拡張であるFocoNet-Echoesについて述べる。
視覚的および聴覚的コンテンツとともにテキストデータを組み込むことで、サッカーゲームのダイナミクスを捉えるアルゴリズムを開発するための総合的なリソースとなることを目的としている。
論文 参考訳(メタデータ) (2024-05-12T18:25:38Z) - Game-MUG: Multimodal Oriented Game Situation Understanding and Commentary Generation Dataset [8.837048597513059]
本稿では,新しいマルチモーダルゲーム状況理解とオーディエンスによるコメント生成データセットであるGAME-MUGを紹介する。
我々のデータセットは、YouTubeとTwitchの2020-2022 LOLゲームライブストリームから収集され、テキスト、オーディオ、時系列イベントログを含むマルチモーダルEスポーツゲーム情報を含んでいる。
また,ゲーム状況とオーディエンス会話理解を網羅して,新たなオーディエンス会話追加コメントデータセットを提案する。
論文 参考訳(メタデータ) (2024-04-30T00:39:26Z) - A Video Is Worth 4096 Tokens: Verbalize Videos To Understand Them In
Zero Shot [67.00455874279383]
そこで本研究では,自然言語による記述を生成するために長編動画を音声化し,生成したストーリーの映像理解タスクを実行することを提案する。
提案手法は,ゼロショットであるにもかかわらず,ビデオ理解のための教師付きベースラインよりもはるかに優れた結果が得られる。
ストーリー理解ベンチマークの欠如を緩和するため,我々は,説得戦略の識別に関する計算社会科学における重要な課題に関する最初のデータセットを公開している。
論文 参考訳(メタデータ) (2023-05-16T19:13:11Z) - SoccerNet-Caption: Dense Video Captioning for Soccer Broadcasts
Commentaries [71.44210436913029]
本稿では,単一のタイムスタンプを固定したテキストコメンタリーの生成に着目した,高密度動画キャプションの新たな課題を提案する。
サッカー放送の715.9時間に約37万のタイムスタンプによるコメントからなる挑戦的なデータセットを提示する。
論文 参考訳(メタデータ) (2023-04-10T13:08:03Z) - A Multi-stage deep architecture for summary generation of soccer videos [11.41978608521222]
本稿では,音声メタデータとイベントメタデータの両方を利用して,サッカーの試合の要約を生成する手法を提案する。
その結果,提案手法は一致の動作を検出し,どの動作が要約に属するべきかを識別し,複数の候補要約を提案する。
論文 参考訳(メタデータ) (2022-05-02T07:26:35Z) - MMSys'22 Grand Challenge on AI-based Video Production for Soccer [2.14475390920102]
この課題は、AIを使用した運用パイプラインの自動化を支援することにある。
特に,イベント検出後に発生する拡張操作に注目した。
論文 参考訳(メタデータ) (2022-02-02T13:53:42Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。