論文の概要: Narrative Shift Detection: A Hybrid Approach of Dynamic Topic Models and Large Language Models
- arxiv url: http://arxiv.org/abs/2506.20269v1
- Date: Wed, 25 Jun 2025 09:25:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.677311
- Title: Narrative Shift Detection: A Hybrid Approach of Dynamic Topic Models and Large Language Models
- Title(参考訳): ナラティブシフト検出:動的トピックモデルと大規模言語モデルのハイブリッドアプローチ
- Authors: Kai-Robin Lange, Tobias Schmidt, Matthias Reccius, Henrik Müller, Michael Roos, Carsten Jentsch,
- Abstract要約: 本稿では,大規模言語モデルの言語理解能力と話題モデルの大規模適用性を組み合わせて,時間的変化を動的にモデル化する手法を提案する。
私たちは2009年から2023年まで、The Wall Street Journalのニュース記事のコーパスにパイプラインを採用しています。
- 参考スコア(独自算出の注目度): 0.4649452333875421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With rapidly evolving media narratives, it has become increasingly critical to not just extract narratives from a given corpus but rather investigate, how they develop over time. While popular narrative extraction methods such as Large Language Models do well in capturing typical narrative elements or even the complex structure of a narrative, applying them to an entire corpus comes with obstacles, such as a high financial or computational cost. We propose a combination of the language understanding capabilities of Large Language Models with the large scale applicability of topic models to dynamically model narrative shifts across time using the Narrative Policy Framework. We apply a topic model and a corresponding change point detection method to find changes that concern a specific topic of interest. Using this model, we filter our corpus for documents that are particularly representative of that change and feed them into a Large Language Model that interprets the change that happened in an automated fashion and distinguishes between content and narrative shifts. We employ our pipeline on a corpus of The Wall Street Journal news paper articles from 2009 to 2023. Our findings indicate that a Large Language Model can efficiently extract a narrative shift if one exists at a given point in time, but does not perform as well when having to decide whether a shift in content or a narrative shift took place.
- Abstract(参考訳): メディアの物語が急速に進化するにつれ、特定のコーパスから物語を抽出するだけでなく、どのように発展していくかを調べることがますます重要になっている。
大きな言語モデルのような一般的な物語抽出法は、典型的な物語要素や物語の複雑な構造を捉えるのにうまく機能するが、それらをコーパス全体に適用するには、高い財務コストや計算コストなどの障害が伴う。
本稿では,大規模言語モデルの言語理解能力と話題モデルの大規模適用性を組み合わせて,ナラティブ・ポリシー・フレームワークを用いて時間的変動を動的にモデル化する手法を提案する。
トピックモデルとそれに対応する変更点検出手法を適用し、特定のトピックに関する変更を見つける。
このモデルを用いて、この変化を特に代表する文書に対してコーパスをフィルタリングし、それらを大規模言語モデルにフィードし、自動化された方法で起きた変化を解釈し、コンテンツと物語のシフトを区別する。
私たちは2009年から2023年まで、The Wall Street Journalのニュース記事のコーパスにパイプラインを採用しています。
以上の結果から,大規模言語モデルでは,ある時点に存在する場合の物語シフトを効率的に抽出できるが,内容の変化や物語シフトの発生の有無を判断する場合には,その効果は得られないことが示唆された。
関連論文リスト
- DiscoSum: Discourse-aware News Summarization [79.4884227574627]
本稿では,談話構造を要約プロセスに統合するための新しいアプローチを提案する。
本稿では,ソーシャルメディアプラットフォーム間で,ニュース記事が複数回,異なる方法で要約される新しい要約データセットを提案する。
本研究では、要約構造を記述するための新しいニュース談話スキーマと、構造認識要約にビームサーチ技術を用いる新しいアルゴリズムであるディスコサムを開発する。
論文 参考訳(メタデータ) (2025-06-07T22:00:30Z) - CAST: Corpus-Aware Self-similarity Enhanced Topic modelling [16.562349140796115]
CAST: Corpus-Aware Self-similarity Enhanced Topic modelling, a novel topic modelling methodを紹介する。
機能的単語が候補話題語として振る舞うのを防ぐための効果的な指標として自己相似性を見出した。
提案手法は,生成したトピックの一貫性と多様性,およびノイズの多いデータを扱うトピックモデルの能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-10-19T15:27:11Z) - A Large Language Model Guided Topic Refinement Mechanism for Short Text Modeling [10.589126787499973]
既存のトピックモデルは、しばしば短いテキストの根底にあるセマンティックなパターンを正確に捉えるのに苦労する。
本稿では,トピックリファインメント(Topic Refinement)と呼ばれる新しいモデル非依存機構を提案する。
トピックリファインメントによりトピックの品質が向上し、トピック関連テキスト分類タスクのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-03-26T13:50:34Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Generating Coherent Narratives by Learning Dynamic and Discrete Entity
States with a Contrastive Framework [68.1678127433077]
我々はトランスフォーマーモデルを拡張して,物語生成のためのエンティティ状態更新と文実現を動的に行う。
2つのナラティブデータセットの実験により、我々のモデルは強いベースラインよりも一貫性があり多様なナラティブを生成できることが示された。
論文 参考訳(メタデータ) (2022-08-08T09:02:19Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z) - Generating Narrative Text in a Switching Dynamical System [20.583487756067022]
スイッチング線形力学系(SLDS)としての物語モデリングの形式化
SLDSは、システムの潜在力学がトップレベルの離散スイッチング変数によって制御される力学系である。
切り替え変数によって導かれる、物語の任意の部分を埋めることのできるモデル用のギブスサンプルを導出する。
論文 参考訳(メタデータ) (2020-04-08T01:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。