論文の概要: Specious Sites: Tracking the Spread and Sway of Spurious News Stories at
Scale
- arxiv url: http://arxiv.org/abs/2308.02068v3
- Date: Sat, 3 Feb 2024 01:14:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 05:43:15.306498
- Title: Specious Sites: Tracking the Spread and Sway of Spurious News Stories at
Scale
- Title(参考訳): specious sites: 大規模なニュース記事の拡散と揺れを追跡するサービス
- Authors: Hans W. A. Hanley, Deepak Kumar, Zakir Durumeric
- Abstract要約: 我々は1,334件の信頼できないニュースサイトで52,036件の物語を識別する。
本稿では,信頼できないニュースサイトから新たな物語を検出するために,我々のシステムをいかに活用できるかを示す。
- 参考スコア(独自算出の注目度): 6.917588580148212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Misinformation, propaganda, and outright lies proliferate on the web, with
some narratives having dangerous real-world consequences on public health,
elections, and individual safety. However, despite the impact of
misinformation, the research community largely lacks automated and programmatic
approaches for tracking news narratives across online platforms. In this work,
utilizing daily scrapes of 1,334 unreliable news websites, the large-language
model MPNet, and DP-Means clustering, we introduce a system to automatically
identify and track the narratives spread within online ecosystems. Identifying
52,036 narratives on these 1,334 websites, we describe the most prevalent
narratives spread in 2022 and identify the most influential websites that
originate and amplify narratives. Finally, we show how our system can be
utilized to detect new narratives originating from unreliable news websites and
to aid fact-checkers in more quickly addressing misinformation. We release code
and data at https://github.com/hanshanley/specious-sites.
- Abstract(参考訳): 誤った情報、プロパガンダ、アウトライトはウェブ上で広まり、一部の物語は公衆の健康、選挙、個人の安全に危険な現実世界の影響をもたらす。
しかし、誤った情報の影響にもかかわらず、研究コミュニティはオンラインプラットフォーム全体のニュースナラティブを追跡するための自動化とプログラムによるアプローチをほとんど欠いている。
本研究では,信頼できないニュースサイト1,334件,大言語モデルMPNet,DP-Meansクラスタリングの日次スクラップを利用して,オンラインエコシステム内の物語を自動的に識別・追跡するシステムを提案する。
これら1,334のウェブサイト上で52,036の物語を特定し,2022年に広く普及した物語を記述し,物語を起源とし増幅する最も影響力のあるウェブサイトを特定する。
最後に,信頼できないニュースサイトから新たな物語を抽出し,事実確認者が誤情報により迅速に対処できるように,我々のシステムをいかに活用できるかを示す。
コードとデータはhttps://github.com/hanshanley/specious-sitesでリリースします。
関連論文リスト
- Finding Fake News Websites in the Wild [0.0860395700487494]
誤情報コンテンツの作成・配信に責任があるウェブサイトを識別する新しい手法を提案する。
さまざまな実行モードやコンテキストを調べて,Twitter上でのアプローチを検証する。
論文 参考訳(メタデータ) (2024-07-09T18:00:12Z) - SCStory: Self-supervised and Continual Online Story Discovery [53.72745249384159]
SCStoryは、素早く公開されたニュース記事ストリームを人間のアノテーションなしでリアルタイムで消化するのに役立つ。
SCStoryは、ニュース記事ストリームのストーリー指向適応モデリングという新しいアイデアを取り入れて、自己指導的かつ継続的な学習を取り入れている。
論文 参考訳(メタデータ) (2023-11-27T04:50:01Z) - Machine-Made Media: Monitoring the Mobilization of Machine-Generated Articles on Misinformation and Mainstream News Websites [5.161088104035108]
私たちは、DeBERTaベースの合成ニュース検出器を訓練し、3,074の誤報とメインストリームのニュースサイトから156万記事以上を分類します。
2022年1月1日から2023年5月1日までの間に、メインストリームのウェブサイトでは、合成ニュース記事の相対数が57.3%増加し、誤情報サイトでは474%増加した。
論文 参考訳(メタデータ) (2023-05-16T21:51:01Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Deep Breath: A Machine Learning Browser Extension to Tackle Online
Misinformation [0.0]
本稿では,オンライン上の誤解を招くコンテンツの検出,処理,警告を行う新しいシステムを提案する。
機械学習モデルを既存の3万2000のクリックベイトニュース記事見出しのデータセットでトレーニングすることにより、このモデルは見出しがセンセーショナルであるかどうかを予測する。
既存の設計原則に基づいたユニークなコンテンツ警告通知を構築するWebブラウザエクステンションとインターフェースする。
論文 参考訳(メタデータ) (2023-01-09T12:43:58Z) - SOK: Fake News Outbreak 2021: Can We Stop the Viral Spread? [5.64512235559998]
ソーシャルネットワークの完全解釈と使いやすさは、今日の世界での情報の生成と配布に革命をもたらした。
従来のメディアチャンネルとは異なり、ソーシャルネットワークは偽情報や偽情報の拡散を迅速かつ広範囲に促進する。
虚偽情報の拡散は、大衆の行動、態度、信念に深刻な影響を及ぼす。
論文 参考訳(メタデータ) (2021-05-22T09:26:13Z) - User Preference-aware Fake News Detection [61.86175081368782]
既存の偽ニュース検出アルゴリズムは、詐欺信号のニュースコンテンツをマイニングすることに焦点を当てている。
本稿では,共同コンテンツとグラフモデリングにより,ユーザの好みから様々な信号を同時にキャプチャする新しいフレームワークUPFDを提案する。
論文 参考訳(メタデータ) (2021-04-25T21:19:24Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - The Rise and Fall of Fake News sites: A Traffic Analysis [62.51737815926007]
偽ニュースサイトのオンラインプレゼンスを調査し、実際のニュースサイトと比較してその行動を特徴づけます。
そこで本研究では,偽ニュースサイトを自動的に検出するコンテンツ非依存のMLを構築した。
論文 参考訳(メタデータ) (2021-03-16T18:10:22Z) - Fake News Spreader Detection on Twitter using Character N-Grams.
Notebook for PAN at CLEF 2020 [0.0]
このノートには、Twitter上の偽ニュース検出タスクのプロファイリングシステムについて書かれている。
我々は多言語の観点から異なる特徴抽出手法と学習実験を行う。
我々のモデルは、英語とスペイン語の公式テストセットで73%と79%の精度を達成しています。
論文 参考訳(メタデータ) (2020-09-29T08:32:32Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。