論文の概要: Identifying economic narratives in large text corpora -- An integrated approach using Large Language Models
- arxiv url: http://arxiv.org/abs/2506.15041v1
- Date: Wed, 18 Jun 2025 01:00:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.513885
- Title: Identifying economic narratives in large text corpora -- An integrated approach using Large Language Models
- Title(参考訳): 大規模テキストコーパスにおける経済物語の同定 -大規模言語モデルを用いた統合的アプローチ-
- Authors: Tobias Schmidt, Kai-Robin Lange, Matthias Reccius, Henrik Müller, Michael Roos, Carsten Jentsch,
- Abstract要約: テキストから経済的な物語を抽出するためのLarge Language Models(LLMs)の利点を評価する。
我々は厳密な物語定義を適用し、GPT-4o出力と専門家アノテータによるゴールドスタンダードな物語を比較した。
以上の結果から, GPT-4oは, 複雑な文書や物語を扱う際には, 専門家レベルの能力に欠けるが, 有効な経済物語を構造化形式で抽出することができることが示唆された。
- 参考スコア(独自算出の注目度): 0.4649452333875421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As interest in economic narratives has grown in recent years, so has the number of pipelines dedicated to extracting such narratives from texts. Pipelines often employ a mix of state-of-the-art natural language processing techniques, such as BERT, to tackle this task. While effective on foundational linguistic operations essential for narrative extraction, such models lack the deeper semantic understanding required to distinguish extracting economic narratives from merely conducting classic tasks like Semantic Role Labeling. Instead of relying on complex model pipelines, we evaluate the benefits of Large Language Models (LLMs) by analyzing a corpus of Wall Street Journal and New York Times newspaper articles about inflation. We apply a rigorous narrative definition and compare GPT-4o outputs to gold-standard narratives produced by expert annotators. Our results suggests that GPT-4o is capable of extracting valid economic narratives in a structured format, but still falls short of expert-level performance when handling complex documents and narratives. Given the novelty of LLMs in economic research, we also provide guidance for future work in economics and the social sciences that employs LLMs to pursue similar objectives.
- Abstract(参考訳): 近年、経済的な物語への関心が高まり、テキストからそのような物語を抽出するためのパイプラインも増えている。
パイプラインには、BERTのような最先端の自然言語処理技術が混在していることが多い。
物語抽出に不可欠な基礎的な言語操作に効果があるが、そのようなモデルは、意味的役割のラベル付けのような古典的なタスクを単に遂行することから抽出する経済的な物語を区別するために必要な深い意味的理解を欠いている。
複雑なモデルパイプラインに頼る代わりに、ウォール・ストリート・ジャーナル紙とニューヨーク・タイムズ紙のインフレーションに関する記事のコーパスを分析して、LLM(Large Language Models)の利点を評価する。
我々は厳密な物語定義を適用し、GPT-4o出力と専門家アノテータによるゴールドスタンダードな物語を比較した。
以上の結果から, GPT-4oは, 複雑な文書や物語を扱う際には, 専門家レベルの性能に欠けるが, 有効な経済物語を構造化形式で抽出できる可能性が示唆された。
経済研究におけるLLMの新規性を考えると、同様の目的を追求するためにLLMを利用する経済と社会科学の今後の研究のためのガイダンスも提供する。
関連論文リスト
- Explingo: Explaining AI Predictions using Large Language Models [47.21393184176602]
LLM(Large Language Models)は、説明を自然なコミュニケーションと整合する人間可読な物語形式に変換することができる。
ナレーターはMLの説明を取り入れ、それらを自然言語の説明に変換する。
グレーダーはこれらの物語を、正確性、完全性、流用性、簡潔さを含む一連の指標で評価する。
この研究の結果はオープンソースツールに統合され、さらなるアプリケーションで物語の説明が利用できるようになった。
論文 参考訳(メタデータ) (2024-12-06T16:01:30Z) - Narrative Analysis of True Crime Podcasts With Knowledge Graph-Augmented Large Language Models [8.78598447041169]
大きな言語モデル(LLM)は、複雑な物語の弧や矛盾する情報を含む物語といまだに苦労している。
最近の研究は、外部知識ベースで強化されたLLMが、結果の精度と解釈可能性を向上させることを示唆している。
本研究では,実際のポッドキャストデータの理解における知識グラフ(KG)の適用性について検討する。
論文 参考訳(メタデータ) (2024-11-01T21:49:00Z) - Mapping News Narratives Using LLMs and Narrative-Structured Text Embeddings [0.0]
構造主義言語理論に基づく数値的物語表現を導入する。
オープンソースLLMを用いてアクタントを抽出し,それをナラティブ構造化テキスト埋め込みに統合する。
本稿では,イスラエル・パレスチナ紛争に関するアル・ジャジーラとワシントン・ポストの新聞記事5000件を例に,本手法の分析的考察を紹介する。
論文 参考訳(メタデータ) (2024-09-10T14:15:30Z) - Are Large Language Models Capable of Generating Human-Level Narratives? [114.34140090869175]
本稿ではストーリーテリングにおけるLLMの能力について考察し,物語の展開とプロットの進行に着目した。
本稿では,3つの談話レベルの側面から物語を分析するための新しい計算フレームワークを提案する。
談話機能の明示的な統合は、ニューラルストーリーテリングの40%以上の改善によって示されるように、ストーリーテリングを促進することができることを示す。
論文 参考訳(メタデータ) (2024-07-18T08:02:49Z) - Can LLMs Learn Macroeconomic Narratives from Social Media? [20.11321226491191]
X(旧Twitter)からの投稿を含む2つのキュレートされたデータセットを導入し、経済に関する物語を捉えた。
自然言語処理(NLP)手法を用いて,ツイートから物語を抽出し,要約する。
我々は、下流の財務予測タスクにツイートを組み込んだ$textitmacroeconomic$予測や、抽出したナラティブの表現を組み込むことで、彼らの予測能力をテストする。
論文 参考訳(メタデータ) (2024-06-17T21:37:09Z) - Can LLMs Understand the Implication of Emphasized Sentences in Dialogue? [64.72966061510375]
強調は人間のコミュニケーションにおいて重要な要素であり、対話における純粋テキストを超えて話者の意図と含意を示す。
本稿では,強調の意味を抽出した強調注釈付き対話サンプルを用いたベンチマークであるEmphasized-Talkを紹介する。
オープンソースと商用の両方で様々な大規模言語モデル(LLM)を評価し,その性能を重要視して評価する。
論文 参考訳(メタデータ) (2024-06-16T20:41:44Z) - GPT-4 Generated Narratives of Life Events using a Structured Narrative Prompt: A Validation Study [0.0]
我々は,OpenAIのGPT-4を用いて,ゼロショット構造化された物語プロンプトを用いて24,000の物語を生成する。
このデータセットから、2,880の物語を手動で分類し、出生、死亡、雇用、解雇の妥当性を評価する。
我々は分析を拡張し、残りの21,120の物語の分類を予測する。
論文 参考訳(メタデータ) (2024-02-08T06:20:01Z) - Mastering the Task of Open Information Extraction with Large Language
Models and Consistent Reasoning Environment [52.592199835286394]
オープン情報抽出(OIE)は、自然文から客観的な構造化された知識を抽出することを目的としている。
大規模言語モデル(LLM)は、テキスト内学習能力に優れています。
論文 参考訳(メタデータ) (2023-10-16T17:11:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。