論文の概要: AI-generated podcasts: Synthetic Intimacy and Cultural Translation in NotebookLM's Audio Overviews
- arxiv url: http://arxiv.org/abs/2511.08654v1
- Date: Thu, 13 Nov 2025 01:01:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.17842
- Title: AI-generated podcasts: Synthetic Intimacy and Cultural Translation in NotebookLM's Audio Overviews
- Title(参考訳): AI生成ポッドキャスト - NotebookLMのオーディオ概要における近親相性と文化翻訳
- Authors: Jill Walker Rettberg,
- Abstract要約: 本稿では,GoogleのNotebookLMが作成したAI生成ポッドキャストについて分析する。
NotebookLMは、ユーザがアップロードしたドキュメントを議論する2つのチャットAIホストを備えたオーディオポッドキャストを生成する。
ポッドキャストの構造が固定テンプレートを中心に構築されているかを示します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper analyses AI-generated podcasts produced by Google's NotebookLM, which generates audio podcasts with two chatty AI hosts discussing whichever documents a user uploads. While AI-generated podcasts have been discussed as tools, for instance in medical education, they have not yet been analysed as media. By uploading different types of text and analysing the generated outputs I show how the podcasts' structure is built around a fixed template. I also find that NotebookLM not only translates texts from other languages into a perky standardised Mid-Western American accent, it also translates cultural contexts to a white, educated, middle-class American default. This is a distinct development in how publics are shaped by media, marking a departure from the multiple public spheres that scholars have described in human podcasting from the early 2000s until today, where hosts spoke to specific communities and responded to listener comments, to an abstraction of the podcast genre.
- Abstract(参考訳): 本稿では、GoogleのNotebookLMが作成したAI生成ポッドキャストを分析し、ユーザがアップロードしたドキュメントを議論する2つのチャットAIホストによるオーディオポッドキャストを生成する。
AI生成ポッドキャストは、例えば医学教育においてツールとして議論されているが、メディアとしてはまだ分析されていない。
異なるタイプのテキストをアップロードし、生成された出力を分析することで、ポッドキャストの構造がどのように固定されたテンプレートの周りに構築されているかを示します。
NotebookLMは、他の言語のテキストを中西部系アメリカ人のアクセントに翻訳するだけでなく、文化的な文脈を白人の教育を受けた中流階級のデフォルトに翻訳する。
これは、2000年代初めから今日まで、学者が人間のポッドキャストで記述した複数のパブリックスフィアから離れて、ホストが特定のコミュニティと話し、リスナーのコメントに反応し、ポッドキャストジャンルの抽象化へと移行した、メディアによって公共がどのように形成されるかという、明確な展開である。
関連論文リスト
- Rhapsody: A Dataset for Highlight Detection in Podcasts [49.576469262265455]
Rhapsodyは13Kポッドキャストのエピソードで、セグメントレベルのハイライトと組み合わせています。
ポッドキャストハイライト検出をセグメントレベルのバイナリ分類タスクとして設定する。
様々なベースライン言語モデルと軽量な微調整言語モデルについて検討する。
論文 参考訳(メタデータ) (2025-05-26T02:39:34Z) - MoonCast: High-Quality Zero-Shot Podcast Generation [81.29927724674602]
MoonCastは高品質のゼロショットポッドキャスト生成ソリューションである。
テキストのみのソースから自然なポッドキャストスタイルの音声を合成することを目的としている。
実験では、MoonCastはベースラインを上回っている。
論文 参考訳(メタデータ) (2025-03-18T15:25:08Z) - Long-Form Speech Generation with Spoken Language Models [64.29591880693468]
テキストなしの音声言語モデルは、数十秒を超える可読な音声を生成するのに苦労する。
我々は、長音の音声から学習し、サンプルする最初の音声言語モデルであるSpeechSSMを導出する。
SpeechSSMは線形時間列モデリングの最近の進歩を活用し、コヒーレンスと効率性において現在のトランスフォーマー音声LMを大幅に上回っている。
論文 参考訳(メタデータ) (2024-12-24T18:56:46Z) - Mapping the Podcast Ecosystem with the Structured Podcast Research Corpus [23.70786221902932]
私たちは2020年5月から6月にかけて、公開RSSフィードを通じて利用可能な110万以上のポッドキャストの大規模なデータセットを紹介します。
このデータはテキストに限らず、オーディオ機能や370Kエピソードのサブセットのスピーカー・ターンも含んでいる。
このデータを用いて、このポピュラーなインパクトのある媒体の内容、構造、応答性に関する基礎的な調査を行う。
論文 参考訳(メタデータ) (2024-11-12T15:56:48Z) - WavJourney: Compositional Audio Creation with Large Language Models [38.39551216587242]
We present WavJourney, a novel framework that leverages Large Language Models to connect various audio model for audio creation。
WavJourneyを使えば、ユーザーはテキストによる説明だけで様々なオーディオ要素でストーリーテリングオーディオコンテンツを作成できる。
We show that WavJourney are capable to synthesize real audio aligned with textual-description semantic, spatial and temporal conditions。
論文 参考訳(メタデータ) (2023-07-26T17:54:04Z) - AudioPaLM: A Large Language Model That Can Speak and Listen [79.44757696533709]
本稿では,音声理解・生成のための大規模言語モデルであるAudioPaLMを紹介する。
AudioPaLMはテキストベースの言語モデルと音声ベースの言語モデルを融合する。
音声認識や音声音声翻訳などの応用により、テキストと音声を処理および生成することができる。
論文 参考訳(メタデータ) (2023-06-22T14:37:54Z) - NewsPod: Automatic and Interactive News Podcasts [18.968547560235347]
NewsPodは自動的に生成されたインタラクティブなニュースポッドキャストだ。
ポッドキャストはニュースイベントを中心にセグメントに分けられ、各セグメントは質問と回答の会話として構成される。
NewsPodの新たな側面は、リスナーが自身の質問をすることでポッドキャストと対話し、自動的に生成された回答を受け取ることを可能にする。
論文 参考訳(メタデータ) (2022-02-15T02:37:04Z) - Topic Modeling on Podcast Short-Text Metadata [0.9539495585692009]
短いテキストのモデリング技術を用いて,ポッドキャストのメタデータやタイトル,記述から関連トピックを発見できる可能性を評価する。
非負行列因子化モデリングフレームワークにおいて、しばしばポッドキャストメタデータに現れる名前付きエンティティ(NE)に対する新しい戦略を提案する。
SpotifyとiTunesとDeezerの既存の2つのデータセットに対する実験により、提案したドキュメント表現であるNEiCEがベースラインの一貫性を改善していることが示された。
論文 参考訳(メタデータ) (2022-01-12T11:07:05Z) - Modeling Language Usage and Listener Engagement in Podcasts [3.8966039534272916]
語彙の多様性、特徴性、感情、構文の様々な要因がエンゲージメントとどのように相関するかを検討する。
異なるテキスト表現を持つモデルを構築し、識別された特徴がエンゲージメントを非常に予測可能であることを示す。
我々の分析は、ハイエンゲージメントポッドキャストのスタイル的要素に関する一般的な知恵を検証し、いくつかの側面を分類し、他の側面に新たな視点を加える。
論文 参考訳(メタデータ) (2021-06-11T20:40:15Z) - A Baseline Analysis for Podcast Abstractive Summarization [18.35061145103997]
本稿では,Spotify Podcastデータセットを用いたポッドキャスト要約のベースライン解析について述べる。
研究者が現在の最先端の事前訓練モデルを理解するのを助け、より良いモデルを作るための基盤を構築することを目的としている。
論文 参考訳(メタデータ) (2020-08-24T18:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。