論文の概要: Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains
- arxiv url: http://arxiv.org/abs/2406.11423v2
- Date: Tue, 17 Sep 2024 16:20:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-18 22:00:57.560071
- Title: Bridging Social Media and Search Engines: Dredge Words and the Detection of Unreliable Domains
- Title(参考訳): ソーシャルメディアと検索エンジンの橋渡し:ドレッジワードと信頼できないドメインの検出
- Authors: Evan M. Williams, Peter Carragher, Kathleen M. Carley,
- Abstract要約: 我々はWebグラフとソーシャルメディアのコンテキストを統合したWebサイト信頼性分類・発見システムを開発した。
本稿では,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を紹介する。
私たちは、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットをリリースしました。
- 参考スコア(独自算出の注目度): 3.659498819753633
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proactive content moderation requires platforms to rapidly and continuously evaluate the credibility of websites. Leveraging the direct and indirect paths users follow to unreliable websites, we develop a website credibility classification and discovery system that integrates both webgraph and large-scale social media contexts. We additionally introduce the concept of dredge words, terms or phrases for which unreliable domains rank highly on search engines, and provide the first exploration of their usage on social media. Our graph neural networks that combine webgraph and social media contexts generate to state-of-the-art results in website credibility classification and significantly improves the top-k identification of unreliable domains. Additionally, we release a novel dataset of dredge words, highlighting their strong connections to both social media and online commerce platforms.
- Abstract(参考訳): プロアクティブなコンテンツモデレーションでは、プラットフォームがWebサイトの信頼性を迅速かつ継続的に評価する必要がある。
ユーザが信頼できないウェブサイトに追従する直接的・間接的なパスを活用することで,Webグラフと大規模ソーシャルメディアのコンテキストを統合したWebサイト信頼性の分類と発見システムを開発する。
さらに,信頼できないドメインが検索エンジン上で高いランクを付けるような単語,用語,フレーズの概念を導入し,ソーシャルメディア上での利用を初めて探究する。
Webグラフとソーシャルメディアのコンテキストを組み合わせたグラフニューラルネットワークは、Webサイトの信頼性分類における最先端の結果を生み出し、信頼性の低いドメインの上位k識別を大幅に改善する。
さらに、ソーシャルメディアとオンラインコマースプラットフォームとの強いつながりを強調した、ドレッジワードの新たなデータセットもリリースしています。
関連論文リスト
- Detection and Discovery of Misinformation Sources using Attributed Webgraphs [3.659498819753633]
本稿では、ラベル付きニュースドメインと、アウトリンクおよびバックリンクドメインへの接続を含む、新しい属性付きWebグラフデータセットを提案する。
本稿では,これらの属性付きWebグラフを用いたニュースサイトの信頼性検出におけるグラフニューラルネットワークの成功例を示す。
また、未知の誤報ニュースソースを発見するための新しいグラフベースのアルゴリズムを導入・評価する。
論文 参考訳(メタデータ) (2024-01-04T17:47:36Z) - Exploring Embeddings for Measuring Text Relatedness: Unveiling
Sentiments and Relationships in Online Comments [1.7230140898679147]
本稿では,様々なソーシャルメディアプラットフォームにおけるコメント間の感情的・意味的関係について検討する。
単語の埋め込みを使って文や文書のコンポーネントを分析する。
我々の分析は、オンラインコメントの相互接続性をより深く理解し、大きな相互接続脳として機能するインターネットの概念を調査する。
論文 参考訳(メタデータ) (2023-09-15T04:57:23Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Nothing Stands Alone: Relational Fake News Detection with Hypergraph
Neural Networks [49.29141811578359]
本稿では,ニュース間のグループ間相互作用を表現するためにハイパーグラフを活用することを提案する。
提案手法は,ラベル付きニュースデータの小さなサブセットであっても,優れた性能を示し,高い性能を維持する。
論文 参考訳(メタデータ) (2022-12-24T00:19:32Z) - A Review of Web Infodemic Analysis and Detection Trends across
Multi-modalities using Deep Neural Networks [3.42658286826597]
フェイクニュース検出は最も分析され、顕著な研究分野の1つである。
Facebook、Reddit、WhatsApp、YouTube、その他のソーシャルアプリケーションは、この新興分野で徐々に注目を集めている。
このレビューは主に、画像、ビデオ、およびそれらのテキストの組み合わせを含むマルチモーダルフェイクニュース検出技術を扱う。
論文 参考訳(メタデータ) (2021-11-23T16:02:28Z) - FR-Detect: A Multi-Modal Framework for Early Fake News Detection on
Social Media Using Publishers Features [0.0]
ニュース分野におけるこれらのメディアの優位性にもかかわらず、制御と検証機構の欠如がフェイクニュースの普及につながっている。
早期検出機能を備えたユーザ関連・コンテンツ関連機能を用いた高精度なマルチモーダルフレームワークFR-Detectを提案する。
実験によると、パブリッシャーの機能はコンテンツベースのモデルの性能を最大13%改善し、精度とF1スコアを29%向上させることができる。
論文 参考訳(メタデータ) (2021-09-10T12:39:00Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z) - A Framework for Pre-processing of Social Media Feeds based on Integrated
Local Knowledge Base [1.5749416770494706]
本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。
このフレームワークは、標準化されたデータセットで94.07%、ツイートから感情を抽出する際には、局所化されたデータセットで99.78%の精度を持っていた。
論文 参考訳(メタデータ) (2020-06-29T07:56:22Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。