論文の概要: SoccerNet-Caption: Dense Video Captioning for Soccer Broadcasts
Commentaries
- arxiv url: http://arxiv.org/abs/2304.04565v1
- Date: Mon, 10 Apr 2023 13:08:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 14:58:20.823934
- Title: SoccerNet-Caption: Dense Video Captioning for Soccer Broadcasts
Commentaries
- Title(参考訳): SoccerNet-Caption: サッカー放送のコメンタリーのためのDense Video Captioning
- Authors: Hassan Mkhallati and Anthony Cioppa and Silvio Giancola and Bernard
Ghanem and Marc Van Droogenbroeck
- Abstract要約: 本稿では,単一のタイムスタンプを固定したテキストコメンタリーの生成に着目した,高密度動画キャプションの新たな課題を提案する。
サッカー放送の715.9時間に約37万のタイムスタンプによるコメントからなる挑戦的なデータセットを提示する。
- 参考スコア(独自算出の注目度): 71.44210436913029
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Soccer is more than just a game - it is a passion that transcends borders and
unites people worldwide. From the roar of the crowds to the excitement of the
commentators, every moment of a soccer match is a thrill. Yet, with so many
games happening simultaneously, fans cannot watch them all live. Notifications
for main actions can help, but lack the engagement of live commentary, leaving
fans feeling disconnected. To fulfill this need, we propose in this paper a
novel task of dense video captioning focusing on the generation of textual
commentaries anchored with single timestamps. To support this task, we
additionally present a challenging dataset consisting of almost 37k timestamped
commentaries across 715.9 hours of soccer broadcast videos. Additionally, we
propose a first benchmark and baseline for this task, highlighting the
difficulty of temporally anchoring commentaries yet showing the capacity to
generate meaningful commentaries. By providing broadcasters with a tool to
summarize the content of their video with the same level of engagement as a
live game, our method could help satisfy the needs of the numerous fans who
follow their team but cannot necessarily watch the live game. We believe our
method has the potential to enhance the accessibility and understanding of
soccer content for a wider audience, bringing the excitement of the game to
more people.
- Abstract(参考訳): サッカーは単なるゲームではない - 国境を越えて世界中の人々を統一するという情熱だ。
観客の怒りからコメンテーターの興奮まで、サッカーの試合のすべての瞬間はスリルです。
しかし、多くのゲームが同時に行われるため、ファンはそれらをすべてライブで見ることはできない。
メインアクションへの通知は役立つが、ライブコメントのエンゲージメントが欠如しており、ファンは離れていると感じている。
このニーズを満たすため,本論文では,単一タイムスタンプに固定されたテキストコメンタリーの生成に着目した,高密度動画キャプションの新たな課題を提案する。
このタスクをサポートするために、715.9時間のサッカー放送ビデオで約37kのタイムスタンプ付きコメンテータからなる挑戦的なデータセットも提示する。
さらに,この課題に対する最初のベンチマークとベースラインを提案し,意味のあるコメントを生成する能力を示しつつも,時間的にコメントをアンカーすることの難しさを強調した。
ブロードキャスターに、ライブゲームと同じレベルのエンゲージメントでビデオのコンテンツを要約するツールを提供することで、この方法では、チームをフォローしているが必ずしもライブゲームを見ることができない多くのファンのニーズを満たすことができる。
本手法は,より広い観客にサッカーコンテンツのアクセシビリティと理解を高める可能性を秘めており,より多くの人に試合の興奮をもたらすものと考えられる。
関連論文リスト
- SoccerNet 2023 Challenges Results [165.5977813812761]
SoccerNet 2023 チャレンジ(英語: SoccerNet 2023 Challenge)は、サッカーネットチームが主催する3回目のビデオ理解チャレンジである。
この第3版では、課題は7つの視覚に基づくタスクから成っており、3つのテーマに分けられた。
論文 参考訳(メタデータ) (2023-09-12T07:03:30Z) - GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for
Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。
私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文 参考訳(メタデータ) (2023-03-26T08:43:36Z) - CS-lol: a Dataset of Viewer Comment with Scene in E-sports
Live-streaming [0.5735035463793008]
何十億ものライブストリーミング視聴者が、リアルタイムで見ているシーンについて意見を共有し、イベントと対話する。
CS-lolは,E-Sportsのライブストリーミングにおけるゲームシーンの記述と組み合わせた,視聴者からのコメントを含むデータセットである。
本稿では,ライブストリーミングイベントのシーンに対する視聴者コメントを検索するタスク,すなわち視聴者コメント検索を提案する。
論文 参考訳(メタデータ) (2023-01-17T13:34:06Z) - Going for GOAL: A Resource for Grounded Football Commentaries [66.10040637644697]
本稿では,GrOunded footbAlLコメンタリー(GOAL)について紹介する。
本稿では,フレームリオーダー,モーメント検索,ライブコメンタリー検索,プレイバイプレイのライブコメンタリー生成といったタスクに対して,最先端のベースラインを提供する。
その結果,ほとんどのタスクにおいてSOTAモデルは合理的に機能することがわかった。
論文 参考訳(メタデータ) (2022-11-08T20:04:27Z) - SoccerNet 2022 Challenges Results [167.6158475931228]
SoccerNet 2022 チャレンジ(英語: SoccerNet 2022 Challenge)は、サッカーネットチームが主催する2回目のビデオ理解チャレンジである。
2022年、課題は6つの視覚ベースのタスクで構成された。
昨年の課題と比較すると、タスク(1-2)は、より厳密な時間的アキュラシーを検討するために評価基準を再定義し、基礎となるデータやアノテーションを含むタスク(3-6)は新しくなった。
論文 参考訳(メタデータ) (2022-10-05T16:12:50Z) - GOAL: Towards Benchmarking Few-Shot Sports Game Summarization [0.3683202928838613]
GOALは,イングランド初のスポーツゲーム要約データセットである。
GOALには103のコメントとニュースのペアがあり、それぞれ2724.9語と476.3語である。
論文 参考訳(メタデータ) (2022-07-18T14:29:18Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。