論文の概要: NewsPod: Automatic and Interactive News Podcasts
- arxiv url: http://arxiv.org/abs/2202.07146v1
- Date: Tue, 15 Feb 2022 02:37:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-16 15:03:03.493883
- Title: NewsPod: Automatic and Interactive News Podcasts
- Title(参考訳): NewsPod: 自動でインタラクティブなニュースポッドキャスト
- Authors: Philippe Laban and Elicia Ye and Srujay Korlakunta and John Canny and
Marti A. Hearst
- Abstract要約: NewsPodは自動的に生成されたインタラクティブなニュースポッドキャストだ。
ポッドキャストはニュースイベントを中心にセグメントに分けられ、各セグメントは質問と回答の会話として構成される。
NewsPodの新たな側面は、リスナーが自身の質問をすることでポッドキャストと対話し、自動的に生成された回答を受け取ることを可能にする。
- 参考スコア(独自算出の注目度): 18.968547560235347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: News podcasts are a popular medium to stay informed and dive deep into news
topics. Today, most podcasts are handcrafted by professionals. In this work, we
advance the state-of-the-art in automatically generated podcasts, making use of
recent advances in natural language processing and text-to-speech technology.
We present NewsPod, an automatically generated, interactive news podcast. The
podcast is divided into segments, each centered on a news event, with each
segment structured as a Question and Answer conversation, whose goal is to
engage the listener. A key aspect of the design is the use of distinct voices
for each role (questioner, responder), to better simulate a conversation.
Another novel aspect of NewsPod allows listeners to interact with the podcast
by asking their own questions and receiving automatically generated answers. We
validate the soundness of this system design through two usability studies,
focused on evaluating the narrative style and interactions with the podcast,
respectively. We find that NewsPod is preferred over a baseline by
participants, with 80% claiming they would use the system in the future.
- Abstract(参考訳): ニュースポッドキャストは、ニューストピックを深く掘り下げて情報を提供し続ける人気メディアだ。
現在、ほとんどのポッドキャストはプロが手作りしている。
本研究では,自然言語処理と音声合成技術における最近の進歩を活かして,自動生成ポッドキャストの最先端を推し進める。
自動生成されたインタラクティブなニュースポッドキャストであるnewspodを紹介します。
ポッドキャストはニュースイベントを中心にセグメンテーションに分けられ、各セグメンションは質問と回答の会話として構成され、リスナーをエンゲージすることを目的としている。
デザインの重要な側面は、会話をより良くシミュレートするために、各役割(クエスト、レスポンダー)に異なる声を使うことである。
NewsPodのもう一つの新しい側面は、リスナーが自身の質問をすることでポッドキャストと対話し、自動的に生成された回答を受け取ることである。
本研究では,2つのユーザビリティ研究を通して,このシステム設計の健全性を検証する。
NewsPodは参加者によってベースラインよりも好まれており、80%が将来このシステムを使うと主張している。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Mapping the Podcast Ecosystem with the Structured Podcast Research Corpus [23.70786221902932]
私たちは2020年5月から6月にかけて、公開RSSフィードを通じて利用可能な110万以上のポッドキャストの大規模なデータセットを紹介します。
このデータはテキストに限らず、オーディオ機能や370Kエピソードのサブセットのスピーカー・ターンも含んでいる。
このデータを用いて、このポピュラーなインパクトのある媒体の内容、構造、応答性に関する基礎的な調査を行う。
論文 参考訳(メタデータ) (2024-11-12T15:56:48Z) - CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations [97.75037148056367]
CoVoMixは、ゼロショット、人間ライク、マルチスピーカー、マルチラウンド対話音声生成のための新しいモデルである。
対話モデリングと生成の有効性を測定するための総合的なメトリクスセットを考案する。
論文 参考訳(メタデータ) (2024-04-10T02:32:58Z) - NewsDialogues: Towards Proactive News Grounded Conversation [72.10055780635625]
本稿では,対話システムがニュースの重要な話題に基づいて会話を積極的にリードする新しいタスク,Proactive News Grounded Conversationを提案する。
この課題をさらに発展させるために、人間と人間の対話データセットtsNewsDialoguesを収集し、合計14.6Kの発話を含む1Kの会話を含む。
論文 参考訳(メタデータ) (2023-08-12T08:33:42Z) - Interactive Conversational Head Generation [68.76774230274076]
対面会話における1つのインターロケータの振る舞いを合成するための新しい対話ヘッド生成ベンチマークを提案する。
長時間・複数回会話に参加可能なインターロカクタを自動的に合成する機能は不可欠であり、様々なアプリケーションにメリットを提供する。
論文 参考訳(メタデータ) (2023-07-05T08:06:26Z) - Knowledge-Grounded Conversational Data Augmentation with Generative
Conversational Networks [76.11480953550013]
生成会話ネットワークを用いて会話データを自動的に生成する。
我々は、Topical Chatデータセット上で、知識のない会話に対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-07-22T22:37:14Z) - Topic Modeling on Podcast Short-Text Metadata [0.9539495585692009]
短いテキストのモデリング技術を用いて,ポッドキャストのメタデータやタイトル,記述から関連トピックを発見できる可能性を評価する。
非負行列因子化モデリングフレームワークにおいて、しばしばポッドキャストメタデータに現れる名前付きエンティティ(NE)に対する新しい戦略を提案する。
SpotifyとiTunesとDeezerの既存の2つのデータセットに対する実験により、提案したドキュメント表現であるNEiCEがベースラインの一貫性を改善していることが示された。
論文 参考訳(メタデータ) (2022-01-12T11:07:05Z) - Responsive Listening Head Generation: A Benchmark Dataset and Baseline [58.168958284290156]
本研究では、応答型リスニングヘッド生成タスクを、複数の入力に応答する動きと表現を持つ非言語ヘッドの合成として定義する。
音声によるジェスチャーや音声のヘッド生成とは違って,いくつかの研究分野の恩恵を期待して,このタスクにより多くのモーダルを導入する。
論文 参考訳(メタデータ) (2021-12-27T07:18:50Z) - Modeling Language Usage and Listener Engagement in Podcasts [3.8966039534272916]
語彙の多様性、特徴性、感情、構文の様々な要因がエンゲージメントとどのように相関するかを検討する。
異なるテキスト表現を持つモデルを構築し、識別された特徴がエンゲージメントを非常に予測可能であることを示す。
我々の分析は、ハイエンゲージメントポッドキャストのスタイル的要素に関する一般的な知恵を検証し、いくつかの側面を分類し、他の側面に新たな視点を加える。
論文 参考訳(メタデータ) (2021-06-11T20:40:15Z) - PodSumm -- Podcast Audio Summarization [0.0]
テキストドメインからのガイダンスを用いて,ポッドキャストの要約を自動的に作成する手法を提案する。
このタスクにはデータセットが不足しているため、内部データセットをキュレートし、データ拡張の効果的なスキームを見つけ、アノテータから要約を集めるためのプロトコルを設計する。
本手法は, ROUGE-F(1/2/L) スコア0.63/0.53/0.63をデータセット上で達成する。
論文 参考訳(メタデータ) (2020-09-22T04:49:33Z) - A Baseline Analysis for Podcast Abstractive Summarization [18.35061145103997]
本稿では,Spotify Podcastデータセットを用いたポッドキャスト要約のベースライン解析について述べる。
研究者が現在の最先端の事前訓練モデルを理解するのを助け、より良いモデルを作るための基盤を構築することを目的としている。
論文 参考訳(メタデータ) (2020-08-24T18:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。