論文の概要: MBIC -- A Media Bias Annotation Dataset Including Annotator
Characteristics
- arxiv url: http://arxiv.org/abs/2105.11910v1
- Date: Thu, 20 May 2021 15:05:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-06 08:53:01.442138
- Title: MBIC -- A Media Bias Annotation Dataset Including Annotator
Characteristics
- Title(参考訳): MBIC -- アノテーション特性を含むメディアバイアスアノテーションデータセット
- Authors: T. Spinde, L. Rudnitckaia, K. Sinha, F. Hamborg, B. Gipp, K. Donnay
- Abstract要約: メディア偏見、あるいはスライスされたニュース報道は、出来事に対する大衆の認識に重大な影響を与える可能性がある。
本稿では,自己開発アノテーションプラットフォームを用いて,そのようなデータをクラウドソーシングするための行列ベースの方法論を提案する。
メディアバイアスの事例を表す1,700のステートメントの最初のサンプルであるMBICも提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many people consider news articles to be a reliable source of information on
current events. However, due to the range of factors influencing news agencies,
such coverage may not always be impartial. Media bias, or slanted news
coverage, can have a substantial impact on public perception of events, and,
accordingly, can potentially alter the beliefs and views of the public. The
main data gap in current research on media bias detection is a robust,
representative, and diverse dataset containing annotations of biased words and
sentences. In particular, existing datasets do not control for the individual
background of annotators, which may affect their assessment and, thus,
represents critical information for contextualizing their annotations. In this
poster, we present a matrix-based methodology to crowdsource such data using a
self-developed annotation platform. We also present MBIC (Media Bias Including
Characteristics) - the first sample of 1,700 statements representing various
media bias instances. The statements were reviewed by ten annotators each and
contain labels for media bias identification both on the word and sentence
level. MBIC is the first available dataset about media bias reporting detailed
information on annotator characteristics and their individual background. The
current dataset already significantly extends existing data in this domain
providing unique and more reliable insights into the perception of bias. In
future, we will further extend it both with respect to the number of articles
and annotators per article.
- Abstract(参考訳): 多くの人は、ニュース記事は現在の出来事に関する情報の信頼できる情報源だと考えている。
しかし、報道機関に影響を及ぼす要因が多岐にわたるため、そのような報道は必ずしも公平ではない。
メディアの偏見、あるいはスライスされたニュース報道は、出来事に対する大衆の認識に重大な影響を与え、それゆえ、大衆の信念や見解を変える可能性がある。
メディアバイアス検出に関する現在の研究の主なデータギャップは、バイアス付き単語と文のアノテーションを含む頑健で代表的で多様なデータセットである。
特に、既存のデータセットはアノテータの個々の背景を制御せず、アノテータの評価に影響を与える可能性があるため、アノテーションを文脈化するための重要な情報を表す。
本稿では,自己開発したアノテーションプラットフォームを用いて,データをクラウドソースするためのマトリックスベース手法を提案する。
MBIC(Media Bias Inclusion Characteristics)も紹介する。メディアバイアスインスタンスを表す1,700のステートメントの最初のサンプルである。
文章は10の注釈者によってレビューされ、単語レベルと文レベルの両方でメディアバイアス識別のためのラベルが含まれている。
MBICは、アノテータの特徴とその個々の背景に関する詳細な情報を報告しているメディアバイアスに関する最初のデータセットである。
現在のデータセットは、この領域の既存のデータをかなり拡張しており、バイアスの知覚に関するユニークで信頼性の高い洞察を提供する。
将来的には、記事数と記事あたりのアノテータ数に関して、さらに拡張します。
関連論文リスト
- Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions [0.7249731529275342]
本稿では,最近発表されたニュースメディアの信頼性評価手法の拡張を提案する。
大規模ニュースメディアハイパーリンクグラフ上での4つの強化学習戦略の分類性能を評価する。
本実験は,2つの難解なバイアス記述子,事実報告と政治的偏見を対象とし,情報源メディアレベルでの大幅な性能向上を示した。
論文 参考訳(メタデータ) (2024-10-23T08:18:26Z) - Distance between Relevant Information Pieces Causes Bias in Long-Context LLMs [50.40165119718928]
LongPiBenchは、複数の関連する情報を含む位置バイアスを評価するために設計されたベンチマークである。
これらの実験によると、現在のほとんどのモデルは「中間の失われた」問題に対して堅牢であるが、関連する情報片の間隔に関する重大なバイアスが存在する。
論文 参考訳(メタデータ) (2024-10-18T17:41:19Z) - Navigating News Narratives: A Media Bias Analysis Dataset [3.0821115746307672]
ニュースナラティブをナビゲートする:メディアバイアス分析データセット"は、メディアバイアスを検出し分析するツールの緊急ニーズに対処する包括的なデータセットである。
このデータセットは幅広いバイアスの範囲を含み、メディア研究と人工知能の分野でユニークな価値ある資産となっている。
論文 参考訳(メタデータ) (2023-11-30T19:59:19Z) - Towards Corpus-Scale Discovery of Selection Biases in News Coverage:
Comparing What Sources Say About Entities as a Start [65.28355014154549]
本稿では,大規模ニュースコーパスにおけるニュースコンテンツから直接メディア選択バイアスのパターンを発見するために,スケーラブルなNLPシステムを構築する上での課題について検討する。
我々は,世界519のニュースソースから180万件のニュース記事のコーパスであるNELA-2020のケーススタディを通じて,フレームワークの能力を示す。
論文 参考訳(メタデータ) (2023-04-06T23:36:45Z) - Bias or Diversity? Unraveling Fine-Grained Thematic Discrepancy in U.S.
News Headlines [63.52264764099532]
われわれは、2014年から2022年までの米国の主要メディアから、180万件のニュース記事の大規模なデータセットを使用している。
我々は、国内政治、経済問題、社会問題、外交の4つの主要なトピックに関連する、きめ細かいテーマの相違を定量化する。
以上の結果から,国内政治や社会問題においては,一定のメディア偏見が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-03-28T03:31:37Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Neural Media Bias Detection Using Distant Supervision With BABE -- Bias
Annotations By Experts [24.51774048437496]
本稿ではメディアバイアス研究のための頑健で多様なデータセットであるBABEについて述べる。
トピックとアウトレットの間でバランスが取れた3,700の文で構成されており、単語と文のレベルにメディアバイアスラベルが含まれている。
また,本データに基づいて,ニュース記事中のバイアス文を自動的に検出する手法も導入した。
論文 参考訳(メタデータ) (2022-09-29T05:32:55Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - Newsalyze: Enabling News Consumers to Understand Media Bias [7.652448987187803]
フェイクニュース」の時代には、ニュース記事のスラントと信頼性を知ることが極めて重要である。
我々はNewsalyzeを紹介します。Newsalyzeは、言葉の選択とラベル付け(WCL)という、微妙で強力なメディアバイアスに焦点をあてたバイアス対応ニュースリーダーです。
WCLバイアスは、ニュースで報告された「フリーダム・ファイター」対「テロリスト」の評価を変えることができる。
論文 参考訳(メタデータ) (2021-05-20T11:20:37Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。