論文の概要: Neural Media Bias Detection Using Distant Supervision With BABE -- Bias
Annotations By Experts
- arxiv url: http://arxiv.org/abs/2209.14557v1
- Date: Thu, 29 Sep 2022 05:32:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:01:57.545661
- Title: Neural Media Bias Detection Using Distant Supervision With BABE -- Bias
Annotations By Experts
- Title(参考訳): babeを用いた遠隔監視によるニューラルメディアバイアス検出 -専門家によるバイアスアノテーション-
- Authors: Timo Spinde, Manuel Plank, Jan-David Krieger, Terry Ruas, Bela Gipp,
Akiko Aizawa
- Abstract要約: 本稿ではメディアバイアス研究のための頑健で多様なデータセットであるBABEについて述べる。
トピックとアウトレットの間でバランスが取れた3,700の文で構成されており、単語と文のレベルにメディアバイアスラベルが含まれている。
また,本データに基づいて,ニュース記事中のバイアス文を自動的に検出する手法も導入した。
- 参考スコア(独自算出の注目度): 24.51774048437496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Media coverage has a substantial effect on the public perception of events.
Nevertheless, media outlets are often biased. One way to bias news articles is
by altering the word choice. The automatic identification of bias by word
choice is challenging, primarily due to the lack of a gold standard data set
and high context dependencies. This paper presents BABE, a robust and diverse
data set created by trained experts, for media bias research. We also analyze
why expert labeling is essential within this domain. Our data set offers better
annotation quality and higher inter-annotator agreement than existing work. It
consists of 3,700 sentences balanced among topics and outlets, containing media
bias labels on the word and sentence level. Based on our data, we also
introduce a way to detect bias-inducing sentences in news articles
automatically. Our best performing BERT-based model is pre-trained on a larger
corpus consisting of distant labels. Fine-tuning and evaluating the model on
our proposed supervised data set, we achieve a macro F1-score of 0.804,
outperforming existing methods.
- Abstract(参考訳): メディアの報道は、イベントに対する大衆の認識に大きな影響を与えている。
しかし、メディアはしばしば偏見を抱いている。
ニュース記事に偏る一つの方法は、単語の選択を変更することである。
単語選択によるバイアスの自動識別は、主にゴールド標準データセットの欠如と高いコンテキスト依存のために困難である。
本稿では,メディアバイアス研究のエキスパートが作成した,堅牢で多様なデータセットであるBABEについて述べる。
また、このドメイン内で専門家のラベル付けが不可欠である理由を分析します。
当社のデータセットは,既存の作業よりもアノテーションの品質とアノテーション間合意が向上しています。
トピックとアウトレットのバランスが取れた3,700の文で構成され、単語と文のレベルでメディアバイアスラベルを含んでいる。
また,本データに基づいて,ニュース記事中のバイアス文を自動的に検出する手法も導入した。
我々の最高のBERTベースのモデルは、遠いラベルからなるより大きなコーパスで事前訓練されている。
提案した教師付きデータセット上でモデルを微調整し評価し,既存の手法よりも高い0.804のマクロF1スコアを達成する。
関連論文リスト
- GradBias: Unveiling Word Influence on Bias in Text-to-Image Generative Models [75.04426753720553]
開集合におけるバイアスを特定し,定量化し,説明するための枠組みを提案する。
このパイプラインはLarge Language Model (LLM)を活用して、一連のキャプションから始まるバイアスを提案する。
このフレームワークには、OpenBiasとGradBiasの2つのバリエーションがあります。
論文 参考訳(メタデータ) (2024-08-29T16:51:07Z) - Take Care of Your Prompt Bias! Investigating and Mitigating Prompt Bias in Factual Knowledge Extraction [56.17020601803071]
近年の研究では、事前学習言語モデル(PLM)が、事実知識抽出において「急激なバイアス」に悩まされていることが示されている。
本稿では,突発バイアスを徹底的に調査し緩和することにより,既存のベンチマークの信頼性を向上させることを目的とする。
論文 参考訳(メタデータ) (2024-03-15T02:04:35Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Exploiting Transformer-based Multitask Learning for the Detection of
Media Bias in News Articles [21.960154864540282]
メディアバイアスを検出するために,マルチタスク学習を用いて学習したトランスフォーマーに基づくディープラーニングアーキテクチャを提案する。
我々の最高のパフォーマンス実装は、マクロ$F_1$の0.776を実現しています。
論文 参考訳(メタデータ) (2022-11-07T12:22:31Z) - NeuS: Neutral Multi-News Summarization for Mitigating Framing Bias [54.89737992911079]
様々な政治スペクトルの複数のニュース見出しから中立的な要約を生成する新しい課題を提案する。
最も興味深い観察の1つは、生成モデルは、事実的に不正確なコンテンツや検証不可能なコンテンツだけでなく、政治的に偏ったコンテンツにも幻覚を与えることができることである。
論文 参考訳(メタデータ) (2022-04-11T07:06:01Z) - An Interdisciplinary Approach for the Automated Detection and
Visualization of Media Bias in News Articles [0.0]
メディアバイアスを識別するためのデータセットや手法を考案することを目指しています。
私のビジョンは、ニュース読者が偏見によるメディアカバレッジの違いを認識できるようにするシステムを開発することです。
論文 参考訳(メタデータ) (2021-12-26T10:46:32Z) - Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。
既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。
本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文 参考訳(メタデータ) (2021-09-16T23:40:28Z) - MBIC -- A Media Bias Annotation Dataset Including Annotator
Characteristics [0.0]
メディア偏見、あるいはスライスされたニュース報道は、出来事に対する大衆の認識に重大な影響を与える可能性がある。
本稿では,自己開発アノテーションプラットフォームを用いて,そのようなデータをクラウドソーシングするための行列ベースの方法論を提案する。
メディアバイアスの事例を表す1,700のステートメントの最初のサンプルであるMBICも提示する。
論文 参考訳(メタデータ) (2021-05-20T15:05:17Z) - Improving Robustness by Augmenting Training Sentences with
Predicate-Argument Structures [62.562760228942054]
データセットバイアスに対するロバスト性を改善する既存のアプローチは、主にトレーニング目標の変更に焦点を当てている。
本稿では,学習データ中の入力文に対応する述語句構造を付加することを提案する。
特定のバイアスを対象とせずに、文の増大は、複数のバイアスに対してトランスフォーマーモデルの堅牢性を向上することを示す。
論文 参考訳(メタデータ) (2020-10-23T16:22:05Z) - Detecting Media Bias in News Articles using Gaussian Bias Distributions [35.19976910093135]
本稿では,記事中の偏りのある文の2次情報がどのように検出効率を向上させるかを検討する。
既存のメディアバイアスデータセットでは、偏りのある文の頻度と位置が記事レベルの偏りに強く影響していることが分かる。
文レベルの偏差検出の標準モデルを用いて,2次情報を用いた記事レベルの偏差検出器が,それ無しで明らかに優れていることを示す実証的証拠を提供する。
論文 参考訳(メタデータ) (2020-10-20T22:20:49Z) - Towards Detection of Subjective Bias using Contextualized Word
Embeddings [9.475039534437332]
Wiki Neutrality Corpus(WNC)を用いたBERTモデルを用いた主観バイアス検出実験を行った。
データセットは、ウィキペディアの編集から360万ドルのラベル付きインスタンスで構成され、バイアスのさまざまなインスタンスを削除する。
論文 参考訳(メタデータ) (2020-02-16T18:39:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。