論文の概要: Mitigation of Diachronic Bias in Fake News Detection Dataset
- arxiv url: http://arxiv.org/abs/2108.12601v1
- Date: Sat, 28 Aug 2021 08:25:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 14:58:51.047499
- Title: Mitigation of Diachronic Bias in Fake News Detection Dataset
- Title(参考訳): 偽ニュース検出データセットにおけるダイアクロニックバイアスの軽減
- Authors: Taichi Murayama and Shoko Wakamiya and Eiji Aramaki
- Abstract要約: フェイクニュースデータセットのほとんどは、特定の期間に依存する。
このようなデータセットでトレーニングされた検出モデルは、政治的変化や社会的変化によって生じる新しい偽ニュースを検出するのに困難である。
ウィキデータを用いたマスキング手法を提案し、人物名の影響を緩和し、偽ニュース検出モデルを堅牢にしているかどうかを検証する。
- 参考スコア(独自算出の注目度): 3.2800968305157205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fake news causes significant damage to society.To deal with these fake news,
several studies on building detection models and arranging datasets have been
conducted. Most of the fake news datasets depend on a specific time period.
Consequently, the detection models trained on such a dataset have difficulty
detecting novel fake news generated by political changes and social changes;
they may possibly result in biased output from the input, including specific
person names and organizational names. We refer to this problem as
\textbf{Diachronic Bias} because it is caused by the creation date of news in
each dataset. In this study, we confirm the bias, especially proper nouns
including person names, from the deviation of phrase appearances in each
dataset. Based on these findings, we propose masking methods using Wikidata to
mitigate the influence of person names and validate whether they make fake news
detection models robust through experiments with in-domain and out-of-domain
data.
- Abstract(参考訳): フェイクニュースは、こうしたフェイクニュースに対処するために、検出モデルの構築とデータセットの整理に関するいくつかの研究が行われている。
偽ニュースデータセットのほとんどは、特定の期間に依存する。
したがって、このようなデータセットで訓練された検出モデルは、政治的変化や社会的変化によって生じる新しい偽ニュースの検出が困難であり、特定の人物名や組織名を含む入力からの偏りのある出力をもたらす可能性がある。
この問題は、各データセットにおけるニュースの生成日によって引き起こされるため、 \textbf{Diachronic Bias} と呼ぶ。
本研究では,各データセットにおける句出現の偏りから,人名を含む適切な名詞の偏りを確認する。
そこで本研究では,ウィキデータを用いたマスキング手法を提案し,ドメイン内およびドメイン外データを用いた実験により,人物名の影響を緩和し,偽ニュース検出モデルを堅牢化するかどうかを検証する。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Unsupervised Domain-agnostic Fake News Detection using Multi-modal Weak
Signals [19.22829945777267]
本研究は,4つのモダリティで利用可能な知識をニュースレコードに埋め込んだ,教師なしフェイクニュース検出のための効果的なフレームワークを提案する。
また,既存のニュースデータセットの潜伏バイアスを最小限に抑えたニュースデータセット構築手法を提案する。
LUND-COVIDを使って提案した教師なしフレームワークをトレーニングし、大規模データセットの可能性を活用した。
論文 参考訳(メタデータ) (2023-05-18T23:49:31Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Generalizing to the Future: Mitigating Entity Bias in Fake News
Detection [30.493485490419403]
本稿では,偽ニュース検出モデルを将来のデータに一般化するエンティティ・デバイアス・フレームワーク(textbfENDEF)を提案する。
エンティティ,ニュースコンテンツ,ニュースの妥当性の因果グラフに基づいて,各原因の寄与を別々にモデル化する。
推論段階では、エンティティの直接効果を取り除き、エンティティバイアスを軽減する。
論文 参考訳(メタデータ) (2022-04-20T14:32:34Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Embracing Domain Differences in Fake News: Cross-domain Fake News
Detection using Multi-modal Data [18.66426327152407]
異なるドメインの偽ニュースを検出するために、ニュースレコードにドメイン固有の知識とクロスドメインの知識を共同で保存する新しいフレームワークを提案する。
提案する偽ニュースモデルと選択的アノテーションアプローチの統合が,クロスドメインニュースデータセットの最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2021-02-11T23:31:14Z) - Connecting the Dots Between Fact Verification and Fake News Detection [21.564628184287173]
本稿では,事実検証と偽ニュース検出の点を結合する,シンプルで効果的な手法を提案する。
提案手法は,最近の事実検証モデルの成功を活用し,ゼロショットフェイクニュースの検出を可能にする。
論文 参考訳(メタデータ) (2020-10-11T09:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。