論文の概要: A Multilingual Similarity Dataset for News Article Frame
- arxiv url: http://arxiv.org/abs/2405.13272v1
- Date: Wed, 22 May 2024 01:01:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-25 01:43:54.112564
- Title: A Multilingual Similarity Dataset for News Article Frame
- Title(参考訳): ニュース記事フレームのための多言語類似性データセット
- Authors: Xi Chen, Mattia Samory, Scott Hale, David Jurgens, Przemyslaw A. Grabowicz,
- Abstract要約: 16,687の新しいラベル付きペアを用いた大規模ラベル付きニュース記事データセットの拡張版を導入する。
本手法は,従来のニュースフレーム分析研究において,フレームクラスを手動で識別する作業を自由化する。
全体としては10言語にまたがって26,555のラベル付きニュース記事ペアで利用可能な、最も広範な言語間ニュース記事類似性データセットを紹介します。
- 参考スコア(独自算出の注目度): 14.977682986280998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding the writing frame of news articles is vital for addressing social issues, and thus has attracted notable attention in the fields of communication studies. Yet, assessing such news article frames remains a challenge due to the absence of a concrete and unified standard dataset that considers the comprehensive nuances within news content. To address this gap, we introduce an extended version of a large labeled news article dataset with 16,687 new labeled pairs. Leveraging the pairwise comparison of news articles, our method frees the work of manual identification of frame classes in traditional news frame analysis studies. Overall we introduce the most extensive cross-lingual news article similarity dataset available to date with 26,555 labeled news article pairs across 10 languages. Each data point has been meticulously annotated according to a codebook detailing eight critical aspects of news content, under a human-in-the-loop framework. Application examples demonstrate its potential in unearthing country communities within global news coverage, exposing media bias among news outlets, and quantifying the factors related to news creation. We envision that this news similarity dataset will broaden our understanding of the media ecosystem in terms of news coverage of events and perspectives across countries, locations, languages, and other social constructs. By doing so, it can catalyze advancements in social science research and applied methodologies, thereby exerting a profound impact on our society.
- Abstract(参考訳): ニュース記事の執筆の枠組みを理解することは、社会問題に取り組む上で不可欠であり、コミュニケーション研究の分野において注目されている。
しかし,ニュースコンテンツ内の包括的ニュアンスを考慮した,具体的で統一された標準データセットが存在しないため,そのようなニュース記事フレームの評価は依然として課題である。
このギャップに対処するため、我々は16,687の新しいラベル付きペアを持つ大規模ラベル付きニュース記事データセットの拡張版を導入する。
本手法は,ニュース記事の相互比較を利用して,従来のニュースフレーム分析研究において,フレームクラスを手動で識別する作業を行う。
全体としては10言語にまたがって26,555のラベル付きニュース記事ペアで利用可能な、最も広範な言語間ニュース記事類似性データセットを紹介します。
それぞれのデータポイントは、ヒューマン・イン・ザ・ループ・フレームワークの下で、ニュースコンテンツの8つの重要な側面を詳述したコードブックに従って慎重に注釈付けされている。
応用例としては、グローバルニュース報道の国内コミュニティの発掘、ニュースメディア間のメディア偏見の暴露、ニュース作成に関連する要因の定量化などが挙げられる。
我々は、このニュース類似性データセットが、国、場所、言語、その他の社会構造における出来事や視点のニュースカバレッジの観点から、メディアエコシステムに対する理解を広げることを期待している。
これにより、社会科学研究や応用方法論の進歩を触媒し、社会に大きな影響を及ぼすことができる。
関連論文リスト
- Understanding News Creation Intents: Frame, Dataset, and Method [21.22991499250969]
ニュース意図とは、ニュース記事の作成の背後にある目的や意図を指す。
我々は、哲学、心理学、認知科学の研究に基づいて、ニュース作成意図を理解するための最初のコンポーネント認識フォーマリズムであるNews INTentを提案する。
論文 参考訳(メタデータ) (2023-12-27T09:35:23Z) - Tracking the Newsworthiness of Public Documents [107.12303391111014]
この研究は、サンフランシスコ・クロニクル(San Francisco Chronicle)によるサンフランシスコ・ベイエリアにおける地方公共政策のニュース報道に焦点を当てている。
まず、新聞記事、公共政策文書、会議記録を収集し、確率的関係モデルを用いてそれらをリンクする。
第二に、ポリシー項目がカバーされるかどうかを予測するために、ニューズサステイネス予測という新しいタスクを定義します。
論文 参考訳(メタデータ) (2023-11-16T10:05:26Z) - An Interactive Framework for Profiling News Media Sources [26.386860411085053]
本稿では,ニュースメディアのプロファイリングのためのインタラクティブなフレームワークを提案する。
グラフベースのニュースメディアプロファイリングモデル、事前訓練された大規模言語モデル、人間の洞察の強みを組み合わせる。
人間のインタラクションが5つにも満たないので、我々のフレームワークはフェイクや偏見のあるニュースメディアを素早く検出できる。
論文 参考訳(メタデータ) (2023-09-14T02:03:45Z) - Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start [65.28355014154549]
本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
論文 参考訳(メタデータ) (2023-04-06T23:36:45Z) - Designing and Evaluating Interfaces that Highlight News Coverage
Diversity Using Discord Questions [84.55145223950427]
本稿は,ニュース記事のための大規模なソースコレクションをナビゲートすることは,それ以上のガイダンスなしでは困難であることを示す。
本稿では,ニュース読者が読みながら範囲の多様性を発見することを目的とした,注釈記事,要約記事,質問表の3つのインタフェースを設計する。
論文 参考訳(メタデータ) (2023-02-17T16:59:31Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Beyond Discrete Genres: Mapping News Items onto a Multidimensional
Framework of Genre Cues [0.0]
ジャンル的手がかりの観点でニュース項目をマッピングするための非離散的フレームワークを提案する。
大量のニュース記事を自動的に分析するために,ニュース文を予測するための2つの計算モデルを提供する。
このアプローチは、ニュースジャンルの進化する性質についての洞察を深めるのに役立ちます。
論文 参考訳(メタデータ) (2022-12-08T10:54:31Z) - Supervised Contrastive Learning for Multimodal Unreliable News Detection
in COVID-19 Pandemic [16.43888233012092]
本稿では,BERTに基づくマルチモーダルな信頼できないニュース検出フレームワークを提案する。
信頼できない記事からテキスト情報と視覚情報をキャプチャする。
信頼性の低いニュース検出において,本モデルが多くの競争ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2021-09-04T11:53:37Z) - BaitWatcher: A lightweight web interface for the detection of
incongruent news headlines [27.29585619643952]
BaitWatcherは軽量なWebインターフェースで、ニュース記事の見出しをクリックする前に、読者が不一致の可能性を推定する。
BaiittWatcherは階層的リカレントエンコーダを使用して、ニュース見出しとその関連するボディテキストの複雑なテキスト表現を効率的に学習する。
論文 参考訳(メタデータ) (2020-03-23T23:43:02Z) - 365 Dots in 2019: Quantifying Attention of News Sources [69.50862982117125]
様々な情報源から,オンラインニュース記事の話題の重複を計測する。
ほぼリアルタイムで注目度に応じてニュースストーリーを採点する。
これにより、最も注目を集めているトピックを識別するなど、複数の研究が可能になる。
論文 参考訳(メタデータ) (2020-03-22T20:32:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。