論文の概要: Dredge Word, Social Media, and Webgraph Networks for Unreliable Website Classification and Identification
- arxiv url: http://arxiv.org/abs/2406.11423v1
- Date: Mon, 17 Jun 2024 11:22:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 15:11:33.143951
- Title: Dredge Word, Social Media, and Webgraph Networks for Unreliable Website Classification and Identification
- Title(参考訳): 信頼できないウェブサイト分類と識別のためのドレッチワード, ソーシャルメディア, およびWebgraph Networks
- Authors: Evan M. Williams, Peter Carragher, Kathleen M. Carley,
- Abstract要約: 本稿では,Webグラフと大規模ソーシャルメディアのコンテキストがWebサイト信頼性の分類と発見システムに与える影響について検討する。
ウェブグラフとソーシャルメディアデータの両方からコンテキストを利用するカリキュラムベースのヘテロジニアスグラフモデルは、均一性と単一モードのアプローチより優れていることを示す。
- 参考スコア(独自算出の注目度): 3.659498819753633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In an attempt to mimic the complex paths through which unreliable content spreads between search engines and social media, we explore the impact of incorporating both webgraph and large-scale social media contexts into website credibility classification and discovery systems. We further explore the usage of what we define as \textit{dredge words} on social media -- terms or phrases for which unreliable domains rank highly. Through comprehensive graph neural network ablations, we demonstrate that curriculum-based heterogeneous graph models that leverage context from both webgraphs and social media data outperform homogeneous and single-mode approaches. We further demonstrate that the incorporation of dredge words into our model strongly associates unreliable websites with social media and online commerce platforms. Finally, we show our heterogeneous model greatly outperforms competing systems in the top-k identification of unlabeled unreliable websites. We demonstrate the strong unreliability signals present in the diverse paths that users follow to uncover unreliable content, and we release a novel dataset of dredge words.
- Abstract(参考訳): 検索エンジンとソーシャルメディアの間で信頼できないコンテンツが拡散する複雑な経路を模倣するために,Webグラフと大規模ソーシャルメディアのコンテキストをWebサイトの信頼性分類・発見システムに組み込むことの影響を考察する。
さらに、ソーシャルメディア上で「textit{dredge words}」と定義するもの(信頼できないドメインが高いランクにある用語やフレーズ)の使用についても検討する。
総合的なグラフニューラルネットワークにより、Webグラフとソーシャルメディアデータの両方のコンテキストを利用するカリキュラムベースの異種グラフモデルが、同種および単一モードのアプローチより優れていることを示す。
さらに、このモデルにヘッジワードを組み込むことで、信頼できないウェブサイトをソーシャルメディアやオンラインコマースプラットフォームと強く結び付けることを実証する。
最後に、不均一なモデルは、信頼できないウェブサイトの上位kの識別において競合するシステムを大幅に上回ることを示す。
我々は、ユーザが信頼できないコンテンツを発見するために追従する多様な経路に存在する強い信頼できない信号を示し、ドレッジワードの新しいデータセットをリリースする。
関連論文リスト
- Detection and Discovery of Misinformation Sources using Attributed Webgraphs [3.659498819753633]
本稿では、ラベル付きニュースドメインと、アウトリンクおよびバックリンクドメインへの接続を含む、新しい属性付きWebグラフデータセットを提案する。
本稿では,これらの属性付きWebグラフを用いたニュースサイトの信頼性検出におけるグラフニューラルネットワークの成功例を示す。
また、未知の誤報ニュースソースを発見するための新しいグラフベースのアルゴリズムを導入・評価する。
論文 参考訳(メタデータ) (2024-01-04T17:47:36Z) - Exploring Embeddings for Measuring Text Relatedness: Unveiling
Sentiments and Relationships in Online Comments [1.7230140898679147]
本稿では,様々なソーシャルメディアプラットフォームにおけるコメント間の感情的・意味的関係について検討する。
単語の埋め込みを使って文や文書のコンポーネントを分析する。
我々の分析は、オンラインコメントの相互接続性をより深く理解し、大きな相互接続脳として機能するインターネットの概念を調査する。
論文 参考訳(メタデータ) (2023-09-15T04:57:23Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - A Review of Web Infodemic Analysis and Detection Trends across
Multi-modalities using Deep Neural Networks [3.42658286826597]
フェイクニュース検出は最も分析され、顕著な研究分野の1つである。
Facebook、Reddit、WhatsApp、YouTube、その他のソーシャルアプリケーションは、この新興分野で徐々に注目を集めている。
このレビューは主に、画像、ビデオ、およびそれらのテキストの組み合わせを含むマルチモーダルフェイクニュース検出技術を扱う。
論文 参考訳(メタデータ) (2021-11-23T16:02:28Z) - FR-Detect: A Multi-Modal Framework for Early Fake News Detection on
Social Media Using Publishers Features [0.0]
ニュース分野におけるこれらのメディアの優位性にもかかわらず、制御と検証機構の欠如がフェイクニュースの普及につながっている。
早期検出機能を備えたユーザ関連・コンテンツ関連機能を用いた高精度なマルチモーダルフレームワークFR-Detectを提案する。
実験によると、パブリッシャーの機能はコンテンツベースのモデルの性能を最大13%改善し、精度とF1スコアを29%向上させることができる。
論文 参考訳(メタデータ) (2021-09-10T12:39:00Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - A Framework for Pre-processing of Social Media Feeds based on Integrated
Local Knowledge Base [1.5749416770494706]
本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。
このフレームワークは、標準化されたデータセットで94.07%、ツイートから感情を抽出する際には、局所化されたデータセットで99.78%の精度を持っていた。
論文 参考訳(メタデータ) (2020-06-29T07:56:22Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。