論文の概要: Fighting Game Commentator with Pitch and Loudness Adjustment Utilizing
Highlight Cues
- arxiv url: http://arxiv.org/abs/2108.08112v1
- Date: Wed, 18 Aug 2021 12:26:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 19:36:26.241683
- Title: Fighting Game Commentator with Pitch and Loudness Adjustment Utilizing
Highlight Cues
- Title(参考訳): ハイライト情報を利用したピッチとラウドネス調整を用いた格闘ゲームコメンテータ
- Authors: Junjie H. Xu, Zhou Fang, Qihang Chen, Satoru Ohno, Pujana Paliyawan
- Abstract要約: 本稿では,戦闘ゲームにおけるリアルタイムゲーム解説のためのコメンテータを提案する。
このコメンタリーは、ゲームプレイ中のシーンを分析して得られるハイライトキューを入力として考慮し、コメンタリーのピッチと大声を調節する。
本研究では,対戦ゲームにおけるパイロット実験を行い,ゲームハイライトのレベルに応じて大音量の調整を行うことにより,ゲームプレイのエンターテイメントを向上できることを示す。
- 参考スコア(独自算出の注目度): 2.053986437152018
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a commentator for providing real-time game commentary in
a fighting game. The commentary takes into account highlight cues, obtained by
analyzing scenes during gameplay, as input to adjust the pitch and loudness of
commentary to be spoken by using a Text-to-Speech (TTS) technology. We
investigate different designs for pitch and loudness adjustment. The proposed
AI consists of two parts: a dynamic adjuster for controlling pitch and loudness
of the TTS and a real-time game commentary generator. We conduct a pilot study
on a fighting game, and our result shows that by adjusting the loudness
significantly according to the level of game highlight, the entertainment of
the gameplay can be enhanced.
- Abstract(参考訳): 本稿では,戦闘ゲームにおけるリアルタイムゲーム解説のためのコメンテータを提案する。
このコメンタリーは、テキスト音声(TTS)技術を用いて、発言するコメンタリーのピッチと大声を調整する入力として、ゲームプレイ中のシーンを分析したハイライトキューを考慮に入れている。
ピッチとラウドネス調整の異なる設計について検討する。
提案するAIは,TSのピッチと音量を制御する動的調整器と,リアルタイムゲーム解説ジェネレータの2つの部分から構成される。
本研究では,対戦ゲームにおけるパイロット実験を行い,ゲームハイライトのレベルに応じて大音量の調整を行うことにより,ゲームプレイのエンターテイメントを向上できることを示す。
関連論文リスト
- MatchTime: Towards Automatic Soccer Game Commentary Generation [52.431010585268865]
観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
論文 参考訳(メタデータ) (2024-06-26T17:57:25Z) - Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [5.1244906826828736]
強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。
本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。
オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文 参考訳(メタデータ) (2024-06-23T11:58:26Z) - Action2Sound: Ambient-Aware Generation of Action Sounds from Egocentric Videos [87.32349247938136]
既存のアプローチでは、トレーニング中にビデオとオーディオの完全な対応を暗黙的に仮定する。
環境に配慮した新しいオーディオ生成モデルAV-LDMを提案する。
我々のアプローチは、観察された視覚コンテンツに忠実にビデオ・オーディオ生成を集中させる最初の方法である。
論文 参考訳(メタデータ) (2024-06-13T16:10:19Z) - Game-MUG: Multimodal Oriented Game Situation Understanding and Commentary Generation Dataset [8.837048597513059]
本稿では,新しいマルチモーダルゲーム状況理解とオーディエンスによるコメント生成データセットであるGAME-MUGを紹介する。
我々のデータセットは、YouTubeとTwitchの2020-2022 LOLゲームライブストリームから収集され、テキスト、オーディオ、時系列イベントログを含むマルチモーダルEスポーツゲーム情報を含んでいる。
また,ゲーム状況とオーディエンス会話理解を網羅して,新たなオーディエンス会話追加コメントデータセットを提案する。
論文 参考訳(メタデータ) (2024-04-30T00:39:26Z) - SoccerNet-Caption: Dense Video Captioning for Soccer Broadcasts
Commentaries [71.44210436913029]
本稿では,単一のタイムスタンプを固定したテキストコメンタリーの生成に着目した,高密度動画キャプションの新たな課題を提案する。
サッカー放送の715.9時間に約37万のタイムスタンプによるコメントからなる挑戦的なデータセットを提示する。
論文 参考訳(メタデータ) (2023-04-10T13:08:03Z) - CS-lol: a Dataset of Viewer Comment with Scene in E-sports
Live-streaming [0.5735035463793008]
何十億ものライブストリーミング視聴者が、リアルタイムで見ているシーンについて意見を共有し、イベントと対話する。
CS-lolは,E-Sportsのライブストリーミングにおけるゲームシーンの記述と組み合わせた,視聴者からのコメントを含むデータセットである。
本稿では,ライブストリーミングイベントのシーンに対する視聴者コメントを検索するタスク,すなわち視聴者コメント検索を提案する。
論文 参考訳(メタデータ) (2023-01-17T13:34:06Z) - Learning to Dub Movies via Hierarchical Prosody Models [167.6465354313349]
テキスト、ビデオクリップ、レファレンスオーディオが与えられたとき、映画ダビング(Visual Voice clone V2C)タスクは、所望の話者音声を参照としてビデオに提示された話者の感情にマッチした音声を生成することを目的としている。
本稿では,これらの問題に階層的韻律モデルを用いて対処する新しい映画ダビングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-12-08T03:29:04Z) - Going for GOAL: A Resource for Grounded Football Commentaries [66.10040637644697]
本稿では,GrOunded footbAlLコメンタリー(GOAL)について紹介する。
本稿では,フレームリオーダー,モーメント検索,ライブコメンタリー検索,プレイバイプレイのライブコメンタリー生成といったタスクに対して,最先端のベースラインを提供する。
その結果,ほとんどのタスクにおいてSOTAモデルは合理的に機能することがわかった。
論文 参考訳(メタデータ) (2022-11-08T20:04:27Z) - Explicit Intensity Control for Accented Text-to-speech [65.35831577398174]
TTSの過程におけるアクセントの強度の制御は、非常に興味深い研究方向である。
近年の作業は、話者とアクセント情報をアンタングルし、そのアクセント強度を制御するために損失重量を調整するために、話者対アダルロスを設計している。
本稿では,アクセント付きTSのための直感的かつ明示的なアクセント強度制御方式を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:23:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。