論文の概要: Fake News Spreader Detection on Twitter using Character N-Grams.
Notebook for PAN at CLEF 2020
- arxiv url: http://arxiv.org/abs/2009.13859v1
- Date: Tue, 29 Sep 2020 08:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 06:09:59.562841
- Title: Fake News Spreader Detection on Twitter using Character N-Grams.
Notebook for PAN at CLEF 2020
- Title(参考訳): 文字N-Gramsを用いたTwitter上のフェイクニューススプレッダ検出
CLEF 2020におけるPANのノートブック
- Authors: Inna Vogel and Meghana Meghana
- Abstract要約: このノートには、Twitter上の偽ニュース検出タスクのプロファイリングシステムについて書かれている。
我々は多言語の観点から異なる特徴抽出手法と学習実験を行う。
我々のモデルは、英語とスペイン語の公式テストセットで73%と79%の精度を達成しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The authors of fake news often use facts from verified news sources and mix
them with misinformation to create confusion and provoke unrest among the
readers. The spread of fake news can thereby have serious implications on our
society. They can sway political elections, push down the stock price or crush
reputations of corporations or public figures. Several websites have taken on
the mission of checking rumors and allegations, but are often not fast enough
to check the content of all the news being disseminated. Especially social
media websites have offered an easy platform for the fast propagation of
information. Towards limiting fake news from being propagated among social
media users, the task of this year's PAN 2020 challenge lays the focus on the
fake news spreaders. The aim of the task is to determine whether it is possible
to discriminate authors that have shared fake news in the past from those that
have never done it. In this notebook, we describe our profiling system for the
fake news detection task on Twitter. For this, we conduct different feature
extraction techniques and learning experiments from a multilingual perspective,
namely English and Spanish. Our final submitted systems use character n-grams
as features in combination with a linear SVM for English and Logistic
Regression for the Spanish language. Our submitted models achieve an overall
accuracy of 73% and 79% on the English and Spanish official test set,
respectively. Our experiments show that it is difficult to differentiate
solidly fake news spreaders on Twitter from users who share credible
information leaving room for further investigations. Our model ranked 3rd out
of 72 competitors.
- Abstract(参考訳): 偽ニュースの著者は、しばしば検証済みのニュースソースから得た事実を誤報と混合して混乱を生じさせ、読者の間に不安を引き起こす。
偽ニュースの拡散は我々の社会に深刻な影響を及ぼす可能性がある。
政治選挙を妨害したり、株価を押し下げたり、企業や著名人の評判を落とすこともできる。
いくつかのウェブサイトが噂や主張をチェックするという使命を担っているが、拡散しているニュースの内容をチェックできるほど高速ではないことが多い。
特にソーシャルメディアのウェブサイトは、情報の迅速な伝播のための簡単なプラットフォームを提供している。
フェイクニュースがソーシャルメディアユーザーの間で広まることを制限するため、今年のpan 2020チャレンジのタスクはフェイクニュース拡散者に焦点を当てている。
この課題の目的は、過去に偽のニュースを共有した著者と、それをしたことのない著者を区別できるかどうかを判断することである。
本稿では,Twitterにおける偽ニュース検出タスクのプロファイリングシステムについて述べる。
そこで我々は,多言語的視点,すなわち英語とスペイン語の異なる特徴抽出手法と学習実験を行った。
最終提出されたシステムでは文字n-gramを英語の線形SVMとスペイン語のロジスティック回帰との組み合わせとして使用しています。
提案モデルはそれぞれ,英語とスペイン語の公式テストセットにおいて,全体の精度73%と79%を達成した。
われわれの実験は、Twitter上の確固たる偽ニューススプレッダーを、信頼できる情報を共有するユーザーと区別することが難しいことを示している。
我々のモデルは72社中3位にランクインした。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Fake News Detection and Behavioral Analysis: Case of COVID-19 [0.22940141855172028]
パンデミックに関する偽ニュースの拡散による「情報デミック」が世界的な問題となっている。
読者は偽ニュースを本当のニュースと間違える可能性があり、その結果、本物の情報にアクセスできなくなる。
ソーシャルメディアの投稿で偽のニュースデータを正確に識別することは困難である。
論文 参考訳(メタデータ) (2023-05-25T13:42:08Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - A Proposed Bi-LSTM Method to Fake News Detection [0.0]
偽ニュースは、アメリカ合衆国大統領選挙の結果に影響を与える決定的な要因となった。
Bi-LSTMは、ニュースが偽物か偽物かを判定するために適用された。
モデルの作成と実行の後、トレーニングデータによるモデル精度が84%、F1-macroスコアが62.0に達した。
論文 参考訳(メタデータ) (2022-06-15T06:36:42Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - Fake News Detection Tools and Methods -- A Review [0.0]
インターネット上で偽ニュースを検出するための様々なアプローチについて,近年の文献について論じる。
公開されているさまざまなデータセットと、利用可能なさまざまなオンラインツールを強調し、Fake Newsをリアルタイムでデバンクすることができる。
論文 参考訳(メタデータ) (2021-11-21T13:19:23Z) - Profiling Fake News Spreaders on Social Media through Psychological and
Motivational Factors [26.942545715296983]
ソーシャルメディア上でのフェイクニューススプレッシャーの特徴と動機要因について検討した。
次に、フェイクニューススプレッドラーが他のユーザーと異なる特徴を示すことができるかどうかを判定する一連の実験を行う。
論文 参考訳(メタデータ) (2021-08-24T20:27:38Z) - Is it Fake? News Disinformation Detection on South African News Websites [0.015863809575305417]
自然言語処理は偽ニュースの検出に広く用いられている。
南アフリカなど、より地域的な文脈では特に問題となる。
本研究では,南アフリカのウェブサイトにおける偽ニュースの検出について調査する。
論文 参考訳(メタデータ) (2021-08-06T04:54:03Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - The Rise and Fall of Fake News sites: A Traffic Analysis [62.51737815926007]
偽ニュースサイトのオンラインプレゼンスを調査し、実際のニュースサイトと比較してその行動を特徴づけます。
そこで本研究では,偽ニュースサイトを自動的に検出するコンテンツ非依存のMLを構築した。
論文 参考訳(メタデータ) (2021-03-16T18:10:22Z) - Causal Understanding of Fake News Dissemination on Social Media [50.4854427067898]
我々は、ユーザーがフェイクニュースを共有するのに、ユーザー属性が何をもたらすかを理解することが重要だと論じている。
偽ニュース拡散において、共同創設者は、本質的にユーザー属性やオンライン活動に関連する偽ニュース共有行動によって特徴づけられる。
本稿では,偽ニュース拡散における選択バイアスを軽減するための原則的アプローチを提案する。
論文 参考訳(メタデータ) (2020-10-20T19:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。