論文の概要: The Media Bias Detector: A Framework for Annotating and Analyzing the News at Scale
- arxiv url: http://arxiv.org/abs/2509.25649v1
- Date: Tue, 30 Sep 2025 01:41:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:44:59.974404
- Title: The Media Bias Detector: A Framework for Annotating and Analyzing the News at Scale
- Title(参考訳): Media Bias Detector: 大規模ニュースの注釈と分析のためのフレームワーク
- Authors: Samar Haider, Amir Tohidi, Jenny S. Wang, Timothy Dörr, David M. Rothschild, Chris Callison-Burch, Duncan J. Watts,
- Abstract要約: 我々は,ニュース報道における選択とフレーミングバイアスを研究するために,大規模で,ほぼリアルタイムなデータセットと計算フレームワークを導入する。
我々のパイプラインは、大規模言語モデルとスケーラブルでほぼリアルタイムなニューススクレイピングを統合し、構造化アノテーションを抽出します。
我々は、これらのカバレッジの次元を、文レベル、記事レベル、出版者レベルなど、複数のレベルで定量化します。
- 参考スコア(独自算出の注目度): 24.955234806377643
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Mainstream news organizations shape public perception not only directly through the articles they publish but also through the choices they make about which topics to cover (or ignore) and how to frame the issues they do decide to cover. However, measuring these subtle forms of media bias at scale remains a challenge. Here, we introduce a large, ongoing (from January 1, 2024 to present), near real-time dataset and computational framework developed to enable systematic study of selection and framing bias in news coverage. Our pipeline integrates large language models (LLMs) with scalable, near-real-time news scraping to extract structured annotations -- including political lean, tone, topics, article type, and major events -- across hundreds of articles per day. We quantify these dimensions of coverage at multiple levels -- the sentence level, the article level, and the publisher level -- expanding the ways in which researchers can analyze media bias in the modern news landscape. In addition to a curated dataset, we also release an interactive web platform for convenient exploration of these data. Together, these contributions establish a reusable methodology for studying media bias at scale, providing empirical resources for future research. Leveraging the breadth of the corpus over time and across publishers, we also present some examples (focused on the 150,000+ articles examined in 2024) that illustrate how this novel data set can reveal insightful patterns in news coverage and bias, supporting academic research and real-world efforts to improve media accountability.
- Abstract(参考訳): メインストリームのニュース組織は、公開する記事だけでなく、どのトピックをカバー(無視)するか、どのようにカバーするかを決めるかという選択を通じて、大衆の認識を形作っている。
しかし、こうした微妙なメディアバイアスを大規模に測定することは依然として困難である。
本稿では,2024年1月1日から現在まで,ニュース報道における選択とフレーミングバイアスの体系的な研究を可能にするために開発された,リアルタイムに近いデータセットと計算フレームワークについて紹介する。
当社のパイプラインでは,大規模言語モデル(LLM)と,スケーラブルでほぼリアルタイムなニューススクレイピングを統合して,政治リーンやトーン,トピック,記事タイプ,メジャーイベントなど,構造化されたアノテーションを毎日数百の記事にわたって抽出しています。
我々は、これらの範囲の次元を、複数のレベル(文レベル、記事レベル、出版者レベル)で定量化し、研究者が現代のニュースの風景の中でメディアバイアスを分析する方法を拡大する。
キュレートされたデータセットに加えて、これらのデータを便利に探索するためのインタラクティブなWebプラットフォームもリリースしています。
これらの貢献は、メディアバイアスを大規模に研究するための再利用可能な方法論を確立し、将来の研究に実証的な資源を提供する。
コーパスの広さを経時的に活用し、また、メディアアカウンタビリティ向上のための学術研究や実世界の取り組みを支援しながら、この新たなデータセットがニュースカバレッジと偏見の洞察に富んだパターンを明らかにする方法について、いくつかの例(2024年に調査された15万記事に焦点をあてた)を提示する。
関連論文リスト
- Media Bias Detector: Designing and Implementing a Tool for Real-Time Selection and Framing Bias Analysis in News Coverage [29.438946779179346]
私たちは、研究者、ジャーナリスト、ニュース消費者のためのツールであるMedia Bias Detectorを紹介します。
大規模な言語モデルを統合することで、出版者レベルに集約されたニュース記事の話題、トーン、政治的傾向、事実について、ほぼリアルタイムに詳細な洞察を提供する。
論文 参考訳(メタデータ) (2025-02-09T19:54:31Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - The Media Bias Taxonomy: A Systematic Literature Review on the Forms and
Automated Detection of Media Bias [5.579028648465784]
本稿は、2019年から2022年の間に発行された3140の論文を体系的にレビューし、メディアバイアスを検出するための計算方法の研究を要約する。
メディアバイアス検出は,近年,トランスフォーマーに基づく分類手法が顕著な進歩をもたらしている,非常に活発な研究分野であることを示す。
論文 参考訳(メタデータ) (2023-12-26T18:13:52Z) - Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start [65.28355014154549]
本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
論文 参考訳(メタデータ) (2023-04-06T23:36:45Z) - Computational Assessment of Hyperpartisanship in News Titles [55.92100606666497]
われわれはまず、超党派ニュースタイトル検出のための新しいデータセットを開発するために、人間の誘導する機械学習フレームワークを採用する。
全体的に右派メディアは比例的に超党派的なタイトルを使う傾向にある。
我々は、外国問題、政治システム、ニュースタイトルにおける過党主義を示唆する社会問題を含む3つの主要なトピックを識別する。
論文 参考訳(メタデータ) (2023-01-16T05:56:58Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - MBIC -- A Media Bias Annotation Dataset Including Annotator
Characteristics [0.0]
メディア偏見、あるいはスライスされたニュース報道は、出来事に対する大衆の認識に重大な影響を与える可能性がある。
本稿では,自己開発アノテーションプラットフォームを用いて,そのようなデータをクラウドソーシングするための行列ベースの方法論を提案する。
メディアバイアスの事例を表す1,700のステートメントの最初のサンプルであるMBICも提示する。
論文 参考訳(メタデータ) (2021-05-20T15:05:17Z) - "Don't quote me on that": Finding Mixtures of Sources in News Articles [85.92467549469147]
各ソースのtextitaffiliationとtextitroleに基づいてソースのオントロジーラベリングシステムを構築します。
これらの属性を名前付きソースに推論し、ニュース記事をこれらのソースの混合物として記述する確率モデルを構築します。
論文 参考訳(メタデータ) (2021-04-19T21:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。