論文の概要: Listening Between the Lines: Decoding Podcast Narratives with Language Modeling
- arxiv url: http://arxiv.org/abs/2511.05310v1
- Date: Fri, 07 Nov 2025 15:12:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.808124
- Title: Listening Between the Lines: Decoding Podcast Narratives with Language Modeling
- Title(参考訳): 行間のリスニング: 言語モデリングによるポッドキャストナラティブのデコード
- Authors: Shreya Gupta, Ojasva Saxena, Arghodeep Nandi, Sarah Masud, Kiran Garimella, Tanmoy Chakraborty,
- Abstract要約: 既存の大規模言語モデルは、一般的にニュース記事のようなより構造化されたテキストで訓練されており、人間のリスナーが物語のフレームを特定するのに頼っている微妙な手がかりを捉えるのに苦労している。
提案手法では,これらの粒度ラベルを用いて,より広範な談話傾向を明らかにする。
- 参考スコア(独自算出の注目度): 17.51119928424848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Podcasts have become a central arena for shaping public opinion, making them a vital source for understanding contemporary discourse. Their typically unscripted, multi-themed, and conversational style offers a rich but complex form of data. To analyze how podcasts persuade and inform, we must examine their narrative structures -- specifically, the narrative frames they employ. The fluid and conversational nature of podcasts presents a significant challenge for automated analysis. We show that existing large language models, typically trained on more structured text such as news articles, struggle to capture the subtle cues that human listeners rely on to identify narrative frames. As a result, current approaches fall short of accurately analyzing podcast narratives at scale. To solve this, we develop and evaluate a fine-tuned BERT model that explicitly links narrative frames to specific entities mentioned in the conversation, effectively grounding the abstract frame in concrete details. Our approach then uses these granular frame labels and correlates them with high-level topics to reveal broader discourse trends. The primary contributions of this paper are: (i) a novel frame-labeling methodology that more closely aligns with human judgment for messy, conversational data, and (ii) a new analysis that uncovers the systematic relationship between what is being discussed (the topic) and how it is being presented (the frame), offering a more robust framework for studying influence in digital media.
- Abstract(参考訳): ポッドキャストは世論を形成するための中心的な場となり、現代の言論を理解するための重要な情報源となっている。
典型的には、非記述的で、マルチテーマで、会話スタイルは、リッチだが複雑なデータ形式を提供する。
ポッドキャストがいかに説得し、どのように情報を伝えるかを分析するには、これらの物語構造、具体的には彼らが採用する物語フレームを調べなければなりません。
ポッドキャストの流動性と会話性は、自動分析において重要な課題である。
既存の大規模言語モデルは、一般的にニュース記事のようなより構造化されたテキストで訓練されており、人間のリスナーが物語のフレームを特定するのに頼っている微妙な手がかりを捉えるのに苦労している。
その結果、現在のアプローチでは、大規模なポッドキャストの物語を正確に分析することができない。
そこで本研究では,会話で言及されている特定のエンティティに物語フレームを明示的にリンクし,抽象的なフレームを具体的詳細で効果的にグルーピングする細調整BERTモデルを開発・評価する。
提案手法では,これらのフレームラベルを高レベルなトピックと相関させて,より広範な談話傾向を明らかにする。
本論文の主な貢献は次のとおりである。
一 乱雑で会話的なデータに対する人間の判断とより密に一致した新しいフレームラベル方式
二 議論されているもの(話題)と提示されているもの(枠組み)の体系的関係を明らかにする新たな分析を行い、デジタルメディアにおける影響力を研究するためのより堅牢な枠組みを提供する。
関連論文リスト
- Narrative Shift Detection: A Hybrid Approach of Dynamic Topic Models and Large Language Models [0.4649452333875421]
本稿では,大規模言語モデルの言語理解能力と話題モデルの大規模適用性を組み合わせて,時間的変化を動的にモデル化する手法を提案する。
私たちは2009年から2023年まで、The Wall Street Journalのニュース記事のコーパスにパイプラインを採用しています。
論文 参考訳(メタデータ) (2025-06-25T09:25:15Z) - DiscoSum: Discourse-aware News Summarization [79.4884227574627]
本稿では,談話構造を要約プロセスに統合するための新しいアプローチを提案する。
本稿では,ソーシャルメディアプラットフォーム間で,ニュース記事が複数回,異なる方法で要約される新しい要約データセットを提案する。
本研究では、要約構造を記述するための新しいニュース談話スキーマと、構造認識要約にビームサーチ技術を用いる新しいアルゴリズムであるディスコサムを開発する。
論文 参考訳(メタデータ) (2025-06-07T22:00:30Z) - Talking Point based Ideological Discourse Analysis in News Events [62.18747509565779]
本稿では,イデオロギー的談話分析理論をモチベーションとして,実世界の出来事に関するニュース記事を分析する枠組みを提案する。
我々のフレームワークは,話題のトピックとともに,エンティティ,役割,メディアフレーム間の相互作用を捉えた,会話ポイントという関係構造を用いたニュース記事を表現している。
我々は,人間の検証によって補足されたイデオロギーや分派的分類タスクを通じて,これらの視点を自動で生成するフレームワークの能力を評価する。
論文 参考訳(メタデータ) (2025-04-10T02:52:34Z) - MoonCast: High-Quality Zero-Shot Podcast Generation [81.29927724674602]
MoonCastは高品質のゼロショットポッドキャスト生成ソリューションである。
テキストのみのソースから自然なポッドキャストスタイルの音声を合成することを目的としている。
実験では、MoonCastはベースラインを上回っている。
論文 参考訳(メタデータ) (2025-03-18T15:25:08Z) - Multi-turn Dialogue Comprehension from a Topic-aware Perspective [70.37126956655985]
本稿では,話題認識の観点から,マルチターン対話をモデル化することを提案する。
対話文のセグメント化アルゴリズムを用いて、対話文を教師なしの方法でトピック集中フラグメントに分割する。
また,トピックセグメントを処理要素として扱う新しいモデルとして,トピック認識デュアルアテンションマッチング(TADAM)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T11:03:55Z) - Topic Modeling on Podcast Short-Text Metadata [0.9539495585692009]
短いテキストのモデリング技術を用いて,ポッドキャストのメタデータやタイトル,記述から関連トピックを発見できる可能性を評価する。
非負行列因子化モデリングフレームワークにおいて、しばしばポッドキャストメタデータに現れる名前付きエンティティ(NE)に対する新しい戦略を提案する。
SpotifyとiTunesとDeezerの既存の2つのデータセットに対する実験により、提案したドキュメント表現であるNEiCEがベースラインの一貫性を改善していることが示された。
論文 参考訳(メタデータ) (2022-01-12T11:07:05Z) - Modeling Language Usage and Listener Engagement in Podcasts [3.8966039534272916]
語彙の多様性、特徴性、感情、構文の様々な要因がエンゲージメントとどのように相関するかを検討する。
異なるテキスト表現を持つモデルを構築し、識別された特徴がエンゲージメントを非常に予測可能であることを示す。
我々の分析は、ハイエンゲージメントポッドキャストのスタイル的要素に関する一般的な知恵を検証し、いくつかの側面を分類し、他の側面に新たな視点を加える。
論文 参考訳(メタデータ) (2021-06-11T20:40:15Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。