論文の概要: Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start
- arxiv url: http://arxiv.org/abs/2304.03414v1
- Date: Thu, 6 Apr 2023 23:36:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 13:21:41.589156
- Title: Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start
- Title(参考訳): ニュース報道における選択バイアスのコーパススケール的発見に向けて--出発点としてエンティティについて語るソースの比較
- Authors: Sihao Chen and William Bruno and Dan Roth
- Abstract要約: 本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
- 参考スコア(独自算出の注目度): 65.28355014154549
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: News sources undergo the process of selecting newsworthy information when
covering a certain topic. The process inevitably exhibits selection biases,
i.e. news sources' typical patterns of choosing what information to include in
news coverage, due to their agenda differences. To understand the magnitude and
implications of selection biases, one must first discover (1) on what topics do
sources typically have diverging definitions of "newsworthy" information, and
(2) do the content selection patterns correlate with certain attributes of the
news sources, e.g. ideological leaning, etc.
The goal of the paper is to investigate and discuss the challenges of
building scalable NLP systems for discovering patterns of media selection
biases directly from news content in massive-scale news corpora, without
relying on labeled data. To facilitate research in this domain, we propose and
study a conceptual framework, where we compare how sources typically mention
certain controversial entities, and use such as indicators for the sources'
content selection preferences. We empirically show the capabilities of the
framework through a case study on NELA-2020, a corpus of 1.8M news articles in
English from 519 news sources worldwide. We demonstrate an unsupervised
representation learning method to capture the selection preferences for how
sources typically mention controversial entities. Our experiments show that
that distributional divergence of such representations, when studied
collectively across entities and news sources, serve as good indicators for an
individual source's ideological leaning. We hope our findings will provide
insights for future research on media selection biases.
- Abstract(参考訳): ニュースソースは、特定のトピックをカバーするときに、ニュースに値する情報を選択するプロセスを実行する。
このプロセスは必然的に選択バイアス、すなわちニュースソースのアジェンダの違いによって、ニュースカバレッジに含まれる情報を選択する典型的なパターンを示す。
選択バイアスの大きさや意味を理解するためには、(1)情報源が「ニュース価値」情報の異なる定義を持っていること、(2)コンテンツ選択パターンがニュースソースの特定の属性(例えば、イデオロギー的傾倒など)と相関すること、などを明らかにする必要がある。
本研究の目的は,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,ラベル付きデータに頼ることなく,スケーラブルなNLPシステムを構築することの課題について検討することである。
この領域での研究を促進するために,提案する概念的枠組みでは,ソースが一般的に議論の的になっているエンティティをどう言及するかを比較検討し,ソースのコンテンツ選択選好の指標として利用する。
我々は,世界中の519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,このフレームワークの能力を実証的に示す。
提案手法は教師なしの表現学習手法であり, 典型的に議論を呼ぶ対象の選択選好を捉えている。
これらの表現の分布のばらつきは、エンティティやニュースソースにまたがって総合的に研究されると、個々の情報源のイデオロギー的傾きの指標となる。
メディア選択バイアスに関する今後の研究に洞察を与えてくれることを願っています。
関連論文リスト
- Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions [0.7249731529275342]
本稿では,最近発表されたニュースメディアの信頼性評価手法の拡張を提案する。
大規模ニュースメディアハイパーリンクグラフ上での4つの強化学習戦略の分類性能を評価する。
本実験は,2つの難解なバイアス記述子,事実報告と政治的偏見を対象とし,情報源メディアレベルでの大幅な性能向上を示した。
論文 参考訳(メタデータ) (2024-10-23T08:18:26Z) - Knowledge Graph Representation for Political Information Sources [16.959319157216466]
我々は、Britbart News(BN)とNew York Times(NYT)の2つのニュースポータルから収集されたデータを分析する。
本研究は,BNおよびNYTメディアポータルから収集した11.5年間のデータセットを用いて,知識グラフを用いて行った。
論文 参考訳(メタデータ) (2024-04-04T13:36:01Z) - From Nuisance to News Sense: Augmenting the News with Cross-Document
Evidence and Context [25.870137795858522]
本稿では,複数のニュース記事からの情報を中心的な話題に集め統合するための,新しいセンスメイキングツールと読書インタフェースであるNEWSSENSEを紹介する。
NEWSSENSEは、異なるソースからの関連記事にリンクすることで、ユーザの選択を集中的に根拠づけた記事を強化する。
我々のパイロット研究は、NEWSSENSEがユーザーが重要な情報を識別し、ニュース記事の信頼性を確認し、異なる視点を探索するのに役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-10-06T21:15:11Z) - Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文 参考訳(メタデータ) (2023-05-24T08:56:35Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Discord Questions: A Computational Approach To Diversity Analysis in
News Coverage [84.55145223950427]
本稿では,情報源の違いを識別し,ニュース報道の多様性を理解する上で,読者を支援する新しい枠組みを提案する。
このフレームワークはDiscord Questionsの生成に基づいている。
論文 参考訳(メタデータ) (2022-11-09T16:37:55Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - How to Effectively Identify and Communicate Person-Targeting Media Bias
in Daily News Consumption? [8.586057042714698]
本稿では,コンテンツ分析のマニュアル処理を初めて自動化した,ニュースレコメンデーションのためのインプログレスシステムを提案する。
我々の推薦者は、個々のニュース記事に実際に存在している重要なフレームを検出し、明らかにする。
本研究は,イベントの異なる設定のニュース記事の推薦が,バイアスに対する意識を著しく向上させることを示す。
論文 参考訳(メタデータ) (2021-10-18T10:13:23Z) - "Don't quote me on that": Finding Mixtures of Sources in News Articles [85.92467549469147]
各ソースのtextitaffiliationとtextitroleに基づいてソースのオントロジーラベリングシステムを構築します。
これらの属性を名前付きソースに推論し、ニュース記事をこれらのソースの混合物として記述する確率モデルを構築します。
論文 参考訳(メタデータ) (2021-04-19T21:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。