Fugu-MT 論文翻訳(概要): Identification of Biased Terms in News Articles by Comparison of Outlet-specific Word Embeddings

論文の概要: Identification of Biased Terms in News Articles by Comparison of Outlet-specific Word Embeddings

arxiv url: http://arxiv.org/abs/2112.07384v1
Date: Tue, 14 Dec 2021 13:23:49 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-15 22:23:53.046408
Title: Identification of Biased Terms in News Articles by Comparison of Outlet-specific Word Embeddings
Title（参考訳）: アウトレット固有の単語埋め込みの比較によるニュース記事中のバイアス項の同定
Authors: Timo Spinde, Lada Rudnitckaia, Felix Hamborg, Bela Gipp
Abstract要約: 我々は2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。本稿では,単語の埋め込みによって測定されたバイアス語の文脈を詳細に考察する。
参考スコア（独自算出の注目度）: 9.379650501033465
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Slanted news coverage, also called media bias, can heavily influence how news consumers interpret and react to the news. To automatically identify biased language, we present an exploratory approach that compares the context of related words. We train two word embedding models, one on texts of left-wing, the other on right-wing news outlets. Our hypothesis is that a word's representations in both word embedding spaces are more similar for non-biased words than biased words. The underlying idea is that the context of biased words in different news outlets varies more strongly than the one of non-biased words, since the perception of a word as being biased differs depending on its context. While we do not find statistical significance to accept the hypothesis, the results show the effectiveness of the approach. For example, after a linear mapping of both word embeddings spaces, 31% of the words with the largest distances potentially induce bias. To improve the results, we find that the dataset needs to be significantly larger, and we derive further methodology as future research direction. To our knowledge, this paper presents the first in-depth look at the context of bias words measured by word embeddings.
Abstract（参考訳）: Slanted Newsの報道は、メディアバイアスとも呼ばれ、ニュース消費者がニュースを解釈し反応する方法に大きな影響を与える。バイアス言語を自動的に識別するために,関連する単語の文脈を比較する探索的アプローチを提案する。 2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。根底にある考え方は、異なるニュースメディアにおける偏りのある単語の文脈は、偏りのある単語の知覚がその文脈によって異なるため、偏りのない単語の文脈よりも強く変化するということである。仮説を受理する統計的意義は見つからないが, 結果はアプローチの有効性を示す。例えば、両方の単語埋め込み空間を線形にマッピングした後、最大距離を持つ単語の31%はバイアスを引き起こす可能性がある。結果を改善するためには,データセットが大幅に大きくなる必要があることが分かり,今後の研究方向としてさらなる方法論が導出される。本稿では,単語埋め込みによって計測されるバイアス単語の文脈を,初めて詳細に検討する。

関連論文リスト

The Table of Media Bias Elements: A sentence-level taxonomy of media bias types and propaganda techniques [0.5524804393257919]
個々の文でパーシャル性がどのように表現されるかというアウトレットの立場から焦点を移すことを目的としている。我々は、メディアバイアスとプロパガンダの微粒で文レベルの分類を導き出すために、密読、学際理論、パイロットアノテーションを反復的に組み合わせている。その結果、38の初等バイアス型からなる2階層のスキーマが、6つの機能ファミリーに配置され、「メディアバイアス要素のテーブル」として視覚化される。
論文参考訳（メタデータ） (2026-01-08T20:18:55Z)
Mitigating Gender Bias in Contextual Word Embeddings [1.208453901299241]
本稿では,コンテキスト埋め込みにおける性別バイアスを大幅に軽減する,リップスティック(マスケ・ランゲージ・モデリング)の新たな目的関数を提案する。また, 静的な埋め込みを嫌悪する新しい手法を提案し, 広範囲な解析と実験による実証実験を行った。
論文参考訳（メタデータ） (2024-11-18T21:36:44Z)
Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文参考訳（メタデータ） (2023-05-04T09:50:25Z)
Addressing Biases in the Texts using an End-to-End Pipeline Approach [0.0]
本稿では,テキストを入力とし,バイアスや有害な内容を含むか否かを判定する,公正なMLパイプラインを提案する。両用した単語を置換することで、新しい単語の集合が提案されるが、その考え方は、それらのバイアスの効果を代替語に置き換えることによって軽減することである。その結果,提案したパイプラインはソーシャルメディアデータのバイアスを検出・識別・緩和できることがわかった。
論文参考訳（メタデータ） (2023-03-13T11:41:28Z)
Discovering and Mitigating Visual Biases through Keyword Explanation [66.71792624377069]
視覚バイアスをキーワードとして解釈するBias-to-Text(B2T)フレームワークを提案する。 B2Tは、CelebAの性別バイアス、ウォーターバードの背景バイアス、ImageNet-R/Cの分布シフトなど、既知のバイアスを特定することができる。 B2Tは、Dollar StreetやImageNetのような大きなデータセットで、新しいバイアスを明らかにする。
論文参考訳（メタデータ） (2023-01-26T13:58:46Z)
Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。 Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文参考訳（メタデータ） (2023-01-14T18:58:42Z)
Lost in Context? On the Sense-wise Variance of Contextualized Word Embeddings [11.475144702935568]
各単語感覚の文脈的埋め込みが、典型的な事前学習モデルにおける文脈によってどの程度異なるかを定量化する。単語表現は位置バイアスを受けており、異なる文脈における最初の単語はより類似する傾向にある。
論文参考訳（メタデータ） (2022-08-20T12:27:25Z)
The SAME score: Improved cosine based bias score for word embeddings [49.75878234192369]
埋め込みにおけるセマンティックバイアスのための新しいバイアススコアであるPetを紹介した。本研究は,下水道作業における意味バイアスを測定し,社会的バイアスの潜在的な原因を特定することができることを示す。
論文参考訳（メタデータ） (2022-03-28T09:28:13Z)
"Thy algorithm shalt not bear false witness": An Evaluation of Multiclass Debiasing Methods on Word Embeddings [3.0204693431381515]
本稿では,最先端のマルチクラス・デバイアス技術であるハード・デバイアス,ソフトウィート・デバイアス,コンセプタ・デバイアスについて検討する。単語埋め込みアソシエーションテスト(WEAT)、平均コサイン類似度(MAC)、相対負性感覚バイアス(RNSB)によるバイアス除去を定量化することにより、共通のバイアス除去時のパフォーマンスを評価する。
論文参考訳（メタデータ） (2020-10-30T12:49:39Z)
Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文参考訳（メタデータ） (2020-10-05T17:19:10Z)
Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation [94.98656228690233]
本稿では,性別サブスペースの推測と削除に先立って,コーパス正規性に対する単語埋め込みを浄化する手法を提案する。本手法は,事前学習した単語埋め込みの分布的意味を保ちつつ,性別バイアスを従来の手法よりもはるかに大きい程度に低減する。
論文参考訳（メタデータ） (2020-05-03T02:33:20Z)
Joint Multiclass Debiasing of Word Embeddings [5.1135133995376085]
本稿では,複数のバイアス次元を同時に脱バイアスできる多クラス脱バイアス手法を提案する。単語埋め込みにおけるベクトル間の有意義な関係を維持しながら、私たちの概念がバイアスを減らすか、あるいは完全に排除できることを示す。
論文参考訳（メタデータ） (2020-03-09T22:06:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。