論文の概要: Entity Framing and Role Portrayal in the News
- arxiv url: http://arxiv.org/abs/2502.14718v1
- Date: Thu, 20 Feb 2025 16:44:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 14:27:52.459608
- Title: Entity Framing and Role Portrayal in the News
- Title(参考訳): ニュースにおけるエンティティ・フレイムと役割・ポートレイダル
- Authors: Tarek Mahmoud, Zhuohan Xie, Dimitar Dimitrov, Nikolaos Nikolaidis, Purificação Silvano, Roman Yangarber, Shivam Sharma, Elisa Sartori, Nicolas Stefanovitch, Giovanni Da San Martino, Jakub Piskorski, Preslav Nakov,
- Abstract要約: データセットには、ウクライナ・ロシア戦争と気候変動という2つの重要な領域に焦点を当てた5つの言語(ブルガリア語、英語、ヒンディー語、ポルトガル語、ロシア語)の最近の1,378のニュース記事が含まれている。
このデータセットはストーリーテリングの要素にインスパイアされた独自の分類を用いており、22のきめ細かい役割、またはアーキタイプが3つの主要なカテゴリ(主人公、敵、無実)に宿営されている。
- 参考スコア(独自算出の注目度): 34.704721889186644
- License:
- Abstract: We introduce a novel multilingual hierarchical corpus annotated for entity framing and role portrayal in news articles. The dataset uses a unique taxonomy inspired by storytelling elements, comprising 22 fine-grained roles, or archetypes, nested within three main categories: protagonist, antagonist, and innocent. Each archetype is carefully defined, capturing nuanced portrayals of entities such as guardian, martyr, and underdog for protagonists; tyrant, deceiver, and bigot for antagonists; and victim, scapegoat, and exploited for innocents. The dataset includes 1,378 recent news articles in five languages (Bulgarian, English, Hindi, European Portuguese, and Russian) focusing on two critical domains of global significance: the Ukraine-Russia War and Climate Change. Over 5,800 entity mentions have been annotated with role labels. This dataset serves as a valuable resource for research into role portrayal and has broader implications for news analysis. We describe the characteristics of the dataset and the annotation process, and we report evaluation results on fine-tuned state-of-the-art multilingual transformers and hierarchical zero-shot learning using LLMs at the level of a document, a paragraph, and a sentence.
- Abstract(参考訳): 本稿では,ニュース記事におけるエンティティ・フレーミングと役割表現にアノテーションを付加した,多言語階層型コーパスを提案する。
このデータセットはストーリーテリングの要素にインスパイアされた独自の分類を用いており、22のきめ細かい役割、またはアーキタイプが3つの主要なカテゴリ(主人公、敵、無実)に宿営されている。
それぞれのアーチタイプは慎重に定義されており、主人公の保護者、反逆者、下犬、敵の暴徒、デシバー、ビゴット、犠牲者、スケープゴート、そして無実の者のために搾取されるような、ニュアンスな実体の描写を捉えている。
このデータセットには、ウクライナ・ロシア戦争と気候変動という2つの重要な領域に焦点を当てた5つの言語(ブルガリア語、英語、ヒンディー語、ポルトガル語、ロシア語)の最近の1,378のニュース記事が含まれている。
5,800以上の団体の言及がロールラベルで注釈付けされている。
このデータセットは役割の描写を研究する上で貴重な情報源であり、ニュース分析に幅広い意味を持つ。
このデータセットの特徴とアノテーションのプロセスについて述べるとともに,文書,段落,文のレベルでのLLMを用いた細調整型多言語変換器と階層型ゼロショット学習の評価結果を報告する。
関連論文リスト
- BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Mapping News Narratives Using LLMs and Narrative-Structured Text Embeddings [0.0]
構造主義言語理論に基づく数値的物語表現を導入する。
オープンソースLLMを用いてアクタントを抽出し,それをナラティブ構造化テキスト埋め込みに統合する。
本稿では,イスラエル・パレスチナ紛争に関するアル・ジャジーラとワシントン・ポストの新聞記事5000件を例に,本手法の分析的考察を紹介する。
論文 参考訳(メタデータ) (2024-09-10T14:15:30Z) - LFED: A Literary Fiction Evaluation Dataset for Large Language Models [58.85989777743013]
元々は中国語で書かれたか、中国語に翻訳された95の文学小説を収集し、数世紀にわたって幅広い話題を扱っている。
質問分類を8つのカテゴリーで定義し,1,304の質問の作成を導く。
我々は、小説の特定の属性(小説の種類、文字番号、出版年など)がLLMのパフォーマンスに与える影響を詳細に分析する。
論文 参考訳(メタデータ) (2024-05-16T15:02:24Z) - Conflicts, Villains, Resolutions: Towards models of Narrative Media
Framing [19.589945994234075]
我々は、物語の要素を明示的に捉えたコミュニケーション科学から、広く使われているフレーミングの概念化を再考する。
我々は、複雑なアノテーションタスクをより単純なバイナリー質問に分解する効果的なアノテーションパラダイムを適用します。
教師付きおよび半教師付きアプローチによるフレームの自動マルチラベル予測について検討する。
論文 参考訳(メタデータ) (2023-06-03T08:50:13Z) - Heroes, Villains, and Victims, and GPT-3: Automated Extraction of
Character Roles Without Training Data [4.718182951842264]
GPT-3は、新聞記事、映画のサマリー、政治演説など、様々な領域の英雄、悪役、犠牲者を特定できる。
本稿では、大規模事前学習言語モデルを用いて、学習データなしで物語テキストからキャラクターロールを抽出する方法を示す。
論文 参考訳(メタデータ) (2022-05-16T10:08:11Z) - Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization [80.94424037751243]
ゼロショット多言語抽出テキスト要約では、通常、モデルは英語のデータセットに基づいて訓練され、他の言語の要約データセットに適用される。
本研究では,NLS(Neural Label Search for Summarization)を提案する。
我々はMLSUMとWikiLinguaのデータセット上で多言語ゼロショット要約実験を行い、人間と自動両方の評価を用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2022-04-28T14:02:16Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - Razmecheno: Named Entity Recognition from Digital Archive of Diaries
"Prozhito" [1.4823641127537543]
本稿では,ロシア語のプロジェクトProzhitoの日記テキストから収集した新しいデータセット"Razmecheno"を作成することを目的とする。
ラズメチーノは1331の文と14119のトークンで構成されており、ペレストロイカ時代に書かれた日記から採集されている。
論文 参考訳(メタデータ) (2022-01-24T23:06:01Z) - Aspectuality Across Genre: A Distributional Semantics Approach [25.816944882581343]
英語における動詞の語彙的側面の解釈は、文的含意を認識し、談話レベルの推論を学ぶ上で重要な役割を担っている。
アスペクト型クラス,状態対イベント,およびテクスチャ対テイリック事象の2つの基本次元を分散意味論で効果的にモデル化できることが示される。
論文 参考訳(メタデータ) (2020-10-31T19:37:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。