論文の概要: Identification of Biased Terms in News Articles by Comparison of
Outlet-specific Word Embeddings
- arxiv url: http://arxiv.org/abs/2112.07384v1
- Date: Tue, 14 Dec 2021 13:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 22:23:53.046408
- Title: Identification of Biased Terms in News Articles by Comparison of
Outlet-specific Word Embeddings
- Title(参考訳): アウトレット固有の単語埋め込みの比較によるニュース記事中のバイアス項の同定
- Authors: Timo Spinde, Lada Rudnitckaia, Felix Hamborg, Bela Gipp
- Abstract要約: 我々は2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。
我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。
本稿では,単語の埋め込みによって測定されたバイアス語の文脈を詳細に考察する。
- 参考スコア(独自算出の注目度): 9.379650501033465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Slanted news coverage, also called media bias, can heavily influence how news
consumers interpret and react to the news. To automatically identify biased
language, we present an exploratory approach that compares the context of
related words. We train two word embedding models, one on texts of left-wing,
the other on right-wing news outlets. Our hypothesis is that a word's
representations in both word embedding spaces are more similar for non-biased
words than biased words. The underlying idea is that the context of biased
words in different news outlets varies more strongly than the one of non-biased
words, since the perception of a word as being biased differs depending on its
context. While we do not find statistical significance to accept the
hypothesis, the results show the effectiveness of the approach. For example,
after a linear mapping of both word embeddings spaces, 31% of the words with
the largest distances potentially induce bias. To improve the results, we find
that the dataset needs to be significantly larger, and we derive further
methodology as future research direction. To our knowledge, this paper presents
the first in-depth look at the context of bias words measured by word
embeddings.
- Abstract(参考訳): Slanted Newsの報道は、メディアバイアスとも呼ばれ、ニュース消費者がニュースを解釈し反応する方法に大きな影響を与える。
バイアス言語を自動的に識別するために,関連する単語の文脈を比較する探索的アプローチを提案する。
2つの単語埋め込みモデルを訓練し、1つは左翼のテキストで、もう1つは右翼のニュースメディアで訓練する。
我々の仮説は、単語の埋め込み空間における表現は、偏りのある単語よりも非偏りのある単語に類似している、というものである。
根底にある考え方は、異なるニュースメディアにおける偏りのある単語の文脈は、偏りのある単語の知覚がその文脈によって異なるため、偏りのない単語の文脈よりも強く変化するということである。
仮説を受理する統計的意義は見つからないが, 結果はアプローチの有効性を示す。
例えば、両方の単語埋め込み空間を線形にマッピングした後、最大距離を持つ単語の31%はバイアスを引き起こす可能性がある。
結果を改善するためには,データセットが大幅に大きくなる必要があることが分かり,今後の研究方向としてさらなる方法論が導出される。
本稿では,単語埋め込みによって計測されるバイアス単語の文脈を,初めて詳細に検討する。
関連論文リスト
- Mitigating Gender Bias in Contextual Word Embeddings [1.208453901299241]
本稿では,コンテキスト埋め込みにおける性別バイアスを大幅に軽減する,リップスティック(マスケ・ランゲージ・モデリング)の新たな目的関数を提案する。
また, 静的な埋め込みを嫌悪する新しい手法を提案し, 広範囲な解析と実験による実証実験を行った。
論文 参考訳(メタデータ) (2024-11-18T21:36:44Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - Addressing Biases in the Texts using an End-to-End Pipeline Approach [0.0]
本稿では,テキストを入力とし,バイアスや有害な内容を含むか否かを判定する,公正なMLパイプラインを提案する。
両用した単語を置換することで、新しい単語の集合が提案されるが、その考え方は、それらのバイアスの効果を代替語に置き換えることによって軽減することである。
その結果,提案したパイプラインはソーシャルメディアデータのバイアスを検出・識別・緩和できることがわかった。
論文 参考訳(メタデータ) (2023-03-13T11:41:28Z) - Discovering and Mitigating Visual Biases through Keyword Explanation [66.71792624377069]
視覚バイアスをキーワードとして解釈するBias-to-Text(B2T)フレームワークを提案する。
B2Tは、CelebAの性別バイアス、ウォーターバードの背景バイアス、ImageNet-R/Cの分布シフトなど、既知のバイアスを特定することができる。
B2Tは、Dollar StreetやImageNetのような大きなデータセットで、新しいバイアスを明らかにする。
論文 参考訳(メタデータ) (2023-01-26T13:58:46Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Lost in Context? On the Sense-wise Variance of Contextualized Word
Embeddings [11.475144702935568]
各単語感覚の文脈的埋め込みが、典型的な事前学習モデルにおける文脈によってどの程度異なるかを定量化する。
単語表現は位置バイアスを受けており、異なる文脈における最初の単語はより類似する傾向にある。
論文 参考訳(メタデータ) (2022-08-20T12:27:25Z) - The SAME score: Improved cosine based bias score for word embeddings [49.75878234192369]
埋め込みにおけるセマンティックバイアスのための新しいバイアススコアであるPetを紹介した。
本研究は,下水道作業における意味バイアスを測定し,社会的バイアスの潜在的な原因を特定することができることを示す。
論文 参考訳(メタデータ) (2022-03-28T09:28:13Z) - "Thy algorithm shalt not bear false witness": An Evaluation of
Multiclass Debiasing Methods on Word Embeddings [3.0204693431381515]
本稿では,最先端のマルチクラス・デバイアス技術であるハード・デバイアス,ソフトウィート・デバイアス,コンセプタ・デバイアスについて検討する。
単語埋め込みアソシエーションテスト(WEAT)、平均コサイン類似度(MAC)、相対負性感覚バイアス(RNSB)によるバイアス除去を定量化することにより、共通のバイアス除去時のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2020-10-30T12:49:39Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation [94.98656228690233]
本稿では,性別サブスペースの推測と削除に先立って,コーパス正規性に対する単語埋め込みを浄化する手法を提案する。
本手法は,事前学習した単語埋め込みの分布的意味を保ちつつ,性別バイアスを従来の手法よりもはるかに大きい程度に低減する。
論文 参考訳(メタデータ) (2020-05-03T02:33:20Z) - Joint Multiclass Debiasing of Word Embeddings [5.1135133995376085]
本稿では,複数のバイアス次元を同時に脱バイアスできる多クラス脱バイアス手法を提案する。
単語埋め込みにおけるベクトル間の有意義な関係を維持しながら、私たちの概念がバイアスを減らすか、あるいは完全に排除できることを示す。
論文 参考訳(メタデータ) (2020-03-09T22:06:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。