論文の概要: Probing Spurious Correlations in Popular Event-Based Rumor Detection
Benchmarks
- arxiv url: http://arxiv.org/abs/2209.08799v1
- Date: Mon, 19 Sep 2022 07:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 16:14:34.108739
- Title: Probing Spurious Correlations in Popular Event-Based Rumor Detection
Benchmarks
- Title(参考訳): 人気事象に基づくうわさ検出ベンチマークにおけるスプリアス相関の探索
- Authors: Jiaying Wu, Bryan Hooi
- Abstract要約: オープンソースのベンチマークデータセットは、既存の研究で無視されている急激な相関に悩まされている。
本稿では,突発的な手がかりを除去する手段として,事象分離型うわさ検出法を提案する。
提案手法は, 有効性, 効率, 一般化性の観点から, 既存のベースラインよりも優れている。
- 参考スコア(独自算出の注目度): 28.550143417847373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As social media becomes a hotbed for the spread of misinformation, the
crucial task of rumor detection has witnessed promising advances fostered by
open-source benchmark datasets. Despite being widely used, we find that these
datasets suffer from spurious correlations, which are ignored by existing
studies and lead to severe overestimation of existing rumor detection
performance. The spurious correlations stem from three causes: (1) event-based
data collection and labeling schemes assign the same veracity label to multiple
highly similar posts from the same underlying event; (2) merging multiple data
sources spuriously relates source identities to veracity labels; and (3)
labeling bias. In this paper, we closely investigate three of the most popular
rumor detection benchmark datasets (i.e., Twitter15, Twitter16 and PHEME), and
propose event-separated rumor detection as a solution to eliminate spurious
cues. Under the event-separated setting, we observe that the accuracy of
existing state-of-the-art models drops significantly by over 40%, becoming only
comparable to a simple neural classifier. To better address this task, we
propose Publisher Style Aggregation (PSA), a generalizable approach that
aggregates publisher posting records to learn writing style and veracity
stance. Extensive experiments demonstrate that our method outperforms existing
baselines in terms of effectiveness, efficiency and generalizability.
- Abstract(参考訳): ソーシャルメディアが誤情報の拡散の温床になるにつれて、うわさ検出の重要なタスクは、オープンソースのベンチマークデータセットによって促進される有望な進歩を目撃している。
広く使われているにもかかわらず、これらのデータセットは、既存の研究によって無視され、既存のうわさ検出性能の過大評価に繋がる急激な相関に悩まされている。
1) イベントベースのデータ収集とラベル付けのスキームは,同一のイベントから同一のveracityラベルを複数の非常に類似したポストに割り当てること,(2)複数のデータソースをマージすることで,ソースidとveracityラベルを積極的に関連付けること,(3) バイアスをラベルすること,の3つの原因から生じる。
本稿では,最も一般的なうわさ検出ベンチマークデータセット(twitter15,twitter16,pheme)の3つを精査し,スプリアスな手がかりを解消するためのソリューションとしてイベント分離うわさ検出を提案する。
イベント分離環境では、既存の最先端モデルの精度が40%以上低下し、単純な神経分類器に匹敵する程度にしかならないことが観察される。
この課題をよりよく解決するために、出版者の投稿記録を集約し、執筆スタイルと妥当性のスタンスを学ぶ一般的なアプローチである、出版者スタイルアグリゲーション(psa)を提案する。
広範な実験により,提案手法が既存のベースラインよりも有効性,効率性,汎用性において優れていることが証明された。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Rumor Detection with a novel graph neural network approach [12.42658463552019]
ソーシャルメディア上での噂を検出するために,ユーザ相関と情報伝達の表現を共同で学習する新しい検出モデルを提案する。
具体的には、グラフニューラルネットワークを利用して、二部グラフからユーザ相関の表現を学習する。
本研究では,ユーザ相関パターンを逆転させるには高いコストが必要であることを示すとともに,ユーザ相関をうわさ検出のために考慮することの重要性を示す。
論文 参考訳(メタデータ) (2024-03-24T15:59:47Z) - ReSup: Reliable Label Noise Suppression for Facial Expression
Recognition [20.74719263734951]
本稿では、ReSupと呼ばれるより信頼性の高いノイズラベル抑圧手法を提案する。
最適な分布モデリングを実現するために、ReSupは全てのサンプルの類似度分布をモデル化する。
ノイズ決定結果の信頼性をさらに高めるため、ReSupは2つのネットワークを使ってノイズ抑制を共同で実現している。
論文 参考訳(メタデータ) (2023-05-29T06:02:06Z) - A Unified Contrastive Transfer Framework with Propagation Structure for
Boosting Low-Resource Rumor Detection [11.201348902221257]
既存の噂検出アルゴリズムは 昨日のニュースで 有望な性能を見せています
十分なトレーニングデータや事前の専門家知識が欠如しているため、予期せぬ出来事に関する噂を見つけるのが苦手である。
本稿では,十分な情報源から得られた特徴を,少数のアノテーションで少ない資料に適応させることで,噂を検出するための一貫したコントラスト転送フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-04T03:13:03Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - SRLF: A Stance-aware Reinforcement Learning Framework for Content-based
Rumor Detection on Social Media [15.985224010346593]
初期のコンテンツベースの方法は、噂の検出のためにテキストとユーザープロファイルから手がかりを見つけることに集中した。
近年の研究では、ユーザのコメントとニュースコンテンツを組み合わせて、真実と偽の噂の違いを捉えている。
本稿では,モデルトレーニングと噂検出のための高品質なラベル付き姿勢データを選択するための,SRLF(Stance-Aware Reinforcement Learning Framework)を提案する。
論文 参考訳(メタデータ) (2021-05-10T03:58:34Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Improving Face Recognition by Clustering Unlabeled Faces in the Wild [77.48677160252198]
極値理論に基づく新しいアイデンティティ分離法を提案する。
重なり合うラベルノイズによる問題を大幅に低減する。
制御された設定と実際の設定の両方の実験は、我々のメソッドの一貫性のある改善を示している。
論文 参考訳(メタデータ) (2020-07-14T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。