論文の概要: A Heuristic-driven Ensemble Framework for COVID-19 Fake News Detection
- arxiv url: http://arxiv.org/abs/2101.03545v1
- Date: Sun, 10 Jan 2021 13:21:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 08:24:52.081056
- Title: A Heuristic-driven Ensemble Framework for COVID-19 Fake News Detection
- Title(参考訳): 新型コロナウイルスのフェイクニュース検出のためのヒューリスティックなアンサンブルフレームワーク
- Authors: Sourya Dipta Das, Ayan Basak and Saikat Dutta
- Abstract要約: 新型コロナウイルスに関連するツイートが「本物」か「フェイク」かを自動で識別するフェイクニュース検知システムについて述べる。
リーダーボードのジョイント8位を達成するためのトレーニング済みモデルで構成されたアンサンブルモデルを使用しています。
F1スコア0.9883のツイートにユーザ名ハンドルとリンクドメインに基づく新しいアルゴリズムを組み込むことで,システムを大幅に改善することができた。
- 参考スコア(独自算出の注目度): 5.979726271522835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The significance of social media has increased manifold in the past few
decades as it helps people from even the most remote corners of the world stay
connected. With the COVID-19 pandemic raging, social media has become more
relevant and widely used than ever before, and along with this, there has been
a resurgence in the circulation of fake news and tweets that demand immediate
attention. In this paper, we describe our Fake News Detection system that
automatically identifies whether a tweet related to COVID-19 is "real" or
"fake", as a part of CONSTRAINT COVID19 Fake News Detection in English
challenge. We have used an ensemble model consisting of pre-trained models that
has helped us achieve a joint 8th position on the leader board. We have
achieved an F1-score of 0.9831 against a top score of 0.9869. Post completion
of the competition, we have been able to drastically improve our system by
incorporating a novel heuristic algorithm based on username handles and link
domains in tweets fetching an F1-score of 0.9883 and achieving state-of-the art
results on the given dataset.
- Abstract(参考訳): ソーシャルメディアの重要性は過去数十年で増し、世界で最も遠く離れた場所の人々がつながり続けるのを助けるようになった。
新型コロナウイルス(covid-19)パンデミック(covid-19)が拡大するにつれ、ソーシャルメディアはこれまで以上に重要で広く利用されるようになった。
本稿では、英語チャレンジにおけるConSTRAINT COVID19 Fake News Detectionの一部として、COVID-19に関連するツイートが「本物」なのか「フェイク」なのかを自動的に識別するフェイクニュース検知システムについて述べる。
我々は、事前訓練されたモデルからなるアンサンブルモデルを使用して、リーダーボードの8番目の共同ポジションを達成するのに役立ちました。
f1-score は 0.9831 でトップスコア 0.9869 に対して達成した。
コンテスト終了後、ユーザ名ハンドルとリンクドメインに基づく新しいヒューリスティックアルゴリズムを導入し、F1スコア0.9883のツイートを抽出し、与えられたデータセットで最先端の成果を得ることにより、システムを大幅に改善することができた。
関連論文リスト
- ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Changes in European Solidarity Before and During COVID-19: Evidence from
a Large Crowd- and Expert-Annotated Twitter Dataset [77.27709662210363]
我々は,NLPにおける教師付き機械学習の新たな課題として,社会的連帯という社会科学的概念とその競争,反連帯の概念を導入する。
我々は,複数のアノテータと2つのアノテーションアプローチ(専門家対群衆)を利用して,(反)整合性表現のための2.3kの英語とドイツ語のつぶやきを注釈する。
今回の結果は、新型コロナウイルス危機で連帯がますます健全になり、競争が激化したことを示している。
論文 参考訳(メタデータ) (2021-08-02T17:03:12Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - A Heuristic-driven Uncertainty based Ensemble Framework for Fake News
Detection in Tweets and News Articles [5.979726271522835]
ニュース項目が「本物」か「偽」かを自動的に識別する新しい偽ニュース検出システムについて述べる。
我々は,事前学習したモデルと統計的特徴融合ネットワークからなるアンサンブルモデルを用いた。
提案手法は,分類タスクの適切なクラス出力信頼度レベルとともに,信頼性の高い予測不確実性を定量化した。
論文 参考訳(メタデータ) (2021-04-05T06:35:30Z) - Cross-SEAN: A Cross-Stitch Semi-Supervised Neural Attention Model for
COVID-19 Fake News Detection [14.771202995527315]
新型コロナウイルス関連の偽ニュースは事実よりも急速に広まっている。
偽ツイートと偽ツイートをラベル付けした最初のcovid-19twitterフェイクニュースデータセットであるctfを紹介します。
また、クロスステッチに基づくセミスーパーバイザーエンドツーエンドの神経注意モデルCross-SEANを提案する。
論文 参考訳(メタデータ) (2021-02-17T18:30:43Z) - Hostility Detection and Covid-19 Fake News Detection in Social Media [1.3499391168620467]
我々は,Hindi BERTとHindi FastTextモデルを用いて,乱用言語検出と特徴抽出を併用したモデルを構築した。
また、英語のツイートでCovid-19に関連する偽ニュースを識別するためのモデルを構築しています。
論文 参考訳(メタデータ) (2021-01-15T03:24:36Z) - TUDublin team at Constraint@AAAI2021 -- COVID19 Fake News Detection [0.0]
仕事の主な目標は、ソーシャルメディアからのメッセージをリアルまたはフェイクニュースとして二分分類するモデルを作成することでした。
このモデルにより、最高の結果の5%以内の0.94 F1スコアを達成できました。
論文 参考訳(メタデータ) (2021-01-14T16:25:32Z) - Transformer based Automatic COVID-19 Fake News Detection System [9.23545668304066]
新型コロナウイルス(COVID-19)のパンデミックでは、誤報が特に多い。
新型コロナウイルスのパンデミックに関するソーシャルメディア上で共有される情報の信頼性を分析する手法を報告する。
テストセットでは0.9855 f1スコアを獲得し,160チーム中5位にランクインした。
論文 参考訳(メタデータ) (2021-01-01T06:49:27Z) - Causal Understanding of Fake News Dissemination on Social Media [50.4854427067898]
我々は、ユーザーがフェイクニュースを共有するのに、ユーザー属性が何をもたらすかを理解することが重要だと論じている。
偽ニュース拡散において、共同創設者は、本質的にユーザー属性やオンライン活動に関連する偽ニュース共有行動によって特徴づけられる。
本稿では,偽ニュース拡散における選択バイアスを軽減するための原則的アプローチを提案する。
論文 参考訳(メタデータ) (2020-10-20T19:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。