論文の概要: Esports Data-to-commentary Generation on Large-scale Data-to-text
Dataset
- arxiv url: http://arxiv.org/abs/2212.10935v1
- Date: Wed, 21 Dec 2022 11:23:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 14:56:57.143222
- Title: Esports Data-to-commentary Generation on Large-scale Data-to-text
Dataset
- Title(参考訳): 大規模データ・ツー・テキストデータセットにおけるesportsデータ・ツー・コンメンタリー生成
- Authors: Zihan Wang and Naoki Yoshinaga
- Abstract要約: 本稿では,構造化データからゲームコメンタリーを生成するタスクを導入し,この問題に対処する。
まず,一般的なエスポートゲームであるLeague of Legendsの構造化データとコメンテータを用いて,大規模なエスポートデータテキストデータセットを構築した。
エスポートの解説の特徴を考慮し, 評価指標として, 正確性, 流布性, 戦略的深さの3つの側面を含む評価指標を設計する。
- 参考スコア(独自算出の注目度): 24.316107750588433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Esports, a sports competition using video games, has become one of the most
important sporting events in recent years. Although the amount of esports data
is increasing than ever, only a small fraction of those data accompanies text
commentaries for the audience to retrieve and understand the plays. Therefore,
in this study, we introduce a task of generating game commentaries from
structured data records to address the problem. We first build a large-scale
esports data-to-text dataset using structured data and commentaries from a
popular esports game, League of Legends. On this dataset, we devise several
data preprocessing methods including linearization and data splitting to
augment its quality. We then introduce several baseline encoder-decoder models
and propose a hierarchical model to generate game commentaries. Considering the
characteristics of esports commentaries, we design evaluation metrics including
three aspects of the output: correctness, fluency, and strategic depth.
Experimental results on our large-scale esports dataset confirmed the advantage
of the hierarchical model, and the results revealed several challenges of this
novel task.
- Abstract(参考訳): ビデオゲームを使ったスポーツ競技であるesportsは、近年最も重要なスポーツイベントの1つとなっている。
esportsデータの量はこれまでになく増加しているが、これらのデータのごく一部だけが、視聴者が戯曲を検索し理解するためにテキストコメンタリーを伴っている。
そこで本研究では,構造化データからゲーム注釈を生成するタスクを導入し,この問題に対処する。
まず,一般的なエスポートゲームであるLeague of Legendsの構造化データと注釈を用いて,大規模なエスポートデータテキストデータセットを構築した。
本データセットでは,線形化やデータ分割を含むデータ前処理手法を考案し,その品質を向上する。
次に,いくつかのベースラインエンコーダデコーダモデルを導入し,ゲーム注釈を生成する階層モデルを提案する。
esportsのコメンテータの特徴を考慮して,出力の3つの側面を含む評価指標(正確性,流動性,戦略的深さ)をデザインする。
大規模エスポートデータセットの実験結果から階層モデルの利点が確認され,本課題のいくつかの課題が明らかになった。
関連論文リスト
- Sports-QA: A Large-Scale Video Question Answering Benchmark for Complex
and Professional Sports [90.79212954022218]
スポーツビデオQAタスク用に特別に設計された最初のデータセットであるSports-QAを紹介する。
Sports-QAデータセットには、説明、時系列、因果関係、反事実条件など、さまざまな種類の質問が含まれている。
質問応答のための時間的情報の特定の尺度に自動的にフォーカスできる新しいオートフォーカス変換器(AFT)を提案する。
論文 参考訳(メタデータ) (2024-01-03T02:22:34Z) - Into the LAIONs Den: Investigating Hate in Multimodal Datasets [67.21783778038645]
本稿では、LAION-400MとLAION-2Bの2つのデータセットの比較監査を通して、ヘイトフルコンテンツに対するデータセットのスケーリングの効果について検討する。
その結果、データセットのスケールによってヘイトコンテンツは12%近く増加し、質的にも定量的にも測定された。
また、画像のみに基づいて算出されたNot Safe For Work(NSFW)値に基づくデータセットの内容のフィルタリングは、アルトテキストにおける有害なコンテンツをすべて排除するものではないことがわかった。
論文 参考訳(メタデータ) (2023-11-06T19:00:05Z) - Going for GOAL: A Resource for Grounded Football Commentaries [66.10040637644697]
本稿では,GrOunded footbAlLコメンタリー(GOAL)について紹介する。
本稿では,フレームリオーダー,モーメント検索,ライブコメンタリー検索,プレイバイプレイのライブコメンタリー生成といったタスクに対して,最先端のベースラインを提供する。
その結果,ほとんどのタスクにおいてSOTAモデルは合理的に機能することがわかった。
論文 参考訳(メタデータ) (2022-11-08T20:04:27Z) - Learning a Grammar Inducer from Massive Uncurated Instructional Videos [118.7279072358029]
映像支援文法帰納法は,映像情報を利用してより正確な構文文法を検索することを目的としている。
我々は手動で設計した機能なしでビデオスパン相関をよりよく学習できる新しいモデルを構築した。
我々のモデルは、ドメイン内のデータに基づいてトレーニングされた従来の最先端システムよりも高いF1スコアが得られる。
論文 参考訳(メタデータ) (2022-10-22T00:22:55Z) - ESTA: An Esports Trajectory and Action Dataset [0.0]
我々はエスポートデータを用いて、勝利予測のための機械学習モデルを開発する。
Awpyはオープンソースのライブラリで、プレイヤーの軌跡やアクションをゲームログから抽出できる。
ESTAは、これまでで最大かつ最も細かく公開されているスポーツデータセットの1つである。
論文 参考訳(メタデータ) (2022-09-20T17:13:50Z) - SC2EGSet: StarCraft II Esport Replay and Game-state Dataset [0.0]
この研究は、StarCraft II esportsトーナメントから生のファイルと事前処理されたファイルを提供することで、幅広い科学コミュニティにエスポートを開放することを目的としている。
トーナメントマッチをゲームエンジンで生成し,低レベルアプリケーションプログラミングインタフェース(API)ライブラリを用いてデータ抽出を行った。
私たちのデータセットには、2016年以来のスタークラフトIIトーナメントのメジャーおよびプレミアのリプレイが含まれています。
論文 参考訳(メタデータ) (2022-07-07T16:52:53Z) - A Multi-stage deep architecture for summary generation of soccer videos [11.41978608521222]
本稿では,音声メタデータとイベントメタデータの両方を利用して,サッカーの試合の要約を生成する手法を提案する。
その結果,提案手法は一致の動作を検出し,どの動作が要約に属するべきかを識別し,複数の候補要約を提案する。
論文 参考訳(メタデータ) (2022-05-02T07:26:35Z) - Knowledge Enhanced Sports Game Summarization [14.389241106925438]
2つの特徴を持つ新しいデータセットであるK-SportsSumを紹介する。
K-SportsSumは大規模なゲームから大量のデータを収集する。
K-SportsSumはさらに、523のスポーツチームと14,724人のスポーツ選手の情報を含む大規模な知識コーパスを提供している。
論文 参考訳(メタデータ) (2021-11-24T15:06:20Z) - SportsSum2.0: Generating High-Quality Sports News from Live Text
Commentary [18.52461327269355]
スポーツゲームの要約は、ライブテキストコメンタリーからニュース記事を生成することを目的としている。
最近の研究であるSportsSumは、大規模なベンチマークデータセットを構築するだけでなく、2段階のフレームワークも提案している。
本稿では,新しいベンチマークデータセットであるSportsSum2.0と,修正された要約フレームワークについて報告する。
論文 参考訳(メタデータ) (2021-10-12T05:39:48Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z) - VIOLIN: A Large-Scale Dataset for Video-and-Language Inference [103.7457132841367]
ビデオとテキストのマルチモーダル理解のための新しいタスク, Video-and-Language Inferenceを導入する。
サブタイトルを前提としたビデオクリップと、そのビデオコンテンツに基づいて自然言語仮説とをペアリングすると、モデルは、その仮説が所定のビデオクリップに関連付けられているか、矛盾しているかを推測する必要がある。
このタスクには、Violin(VIdeO-and-Language Inference)という名の新しい大規模データセットが導入された。
論文 参考訳(メタデータ) (2020-03-25T20:39:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。