論文の概要: EGGS: A Flexible Approach to Relational Modeling of Social Network Spam
- arxiv url: http://arxiv.org/abs/2001.04909v2
- Date: Tue, 28 Jan 2020 22:10:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 13:45:01.588536
- Title: EGGS: A Flexible Approach to Relational Modeling of Social Network Spam
- Title(参考訳): EGGS:ソーシャルネットワークスパムのリレーショナルモデリングへの柔軟なアプローチ
- Authors: Jonathan Brophy and Daniel Lowd
- Abstract要約: 本稿では,スパムのための拡張グループ型グラフィカルモデルを提案する。
私たちは、同じ著者、同じコンテンツ、または他のドメイン固有のコネクションがあるときに、関連したメッセージをまとめます。
EGGSは、ほとんどの実験環境では独立したモデルよりも正確である。
- 参考スコア(独自算出の注目度): 13.109852233032395
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social networking websites face a constant barrage of spam, unwanted messages
that distract, annoy, and even defraud honest users. These messages tend to be
very short, making them difficult to identify in isolation. Furthermore,
spammers disguise their messages to look legitimate, tricking users into
clicking on links and tricking spam filters into tolerating their malicious
behavior. Thus, some spam filters examine relational structure in the domain,
such as connections among users and messages, to better identify deceptive
content. However, even when it is used, relational structure is often exploited
in an incomplete or ad hoc manner. In this paper, we present Extended
Group-based Graphical models for Spam (EGGS), a general-purpose method for
classifying spam in online social networks. Rather than labeling each message
independently, we group related messages together when they have the same
author, the same content, or other domain-specific connections. To reason about
related messages, we combine two popular methods: stacked graphical learning
(SGL) and probabilistic graphical models (PGM). Both methods capture the idea
that messages are more likely to be spammy when related messages are also
spammy, but they do so in different ways; SGL uses sequential classifier
predictions and PGMs use probabilistic inference. We apply our method to four
different social network domains. EGGS is more accurate than an independent
model in most experimental settings, especially when the correct label is
uncertain. For the PGM implementation, we compare Markov logic networks to
probabilistic soft logic and find that both work well with neither one
dominating, and the combination of SGL and PGMs usually performs better than
either on its own.
- Abstract(参考訳): ソーシャルネットワーキングのWebサイトは、スパムや不必要なメッセージが絶え間なく出回っている。
これらのメッセージは非常に短く、分離して識別することが困難になる傾向がある。
さらにスパマーは、メッセージを偽装して正当に見せかけ、ユーザーにリンクをクリックさせ、スパムフィルターを騙して悪質な行動を緩和させる。
したがって、一部のスパムフィルタは、ユーザやメッセージ間の接続のようなドメイン内の関係構造を調べ、偽コンテンツをよりよく識別する。
しかし、たとえ使用しても、リレーショナル構造は不完全あるいはアドホックな方法で利用されることがしばしばある。
本稿では,オンラインソーシャルネットワーク上でスパムを分類する汎用手法であるExpended Group-based Graphical Model for Spam (EGGS)を提案する。
それぞれのメッセージを個別にラベル付けるのではなく、同じ著者、同じコンテンツ、あるいは他のドメイン固有の接続があるときに関連したメッセージをグループ化する。
関連するメッセージを理解するために,stacked graphical learning (sgl) と probabilistic graphical models (pgm) という2つの手法を組み合わせた。
どちらの方法も、関連するメッセージがスパムである場合、メッセージはよりスパムになりやすいという考えを捉えているが、それらは異なる方法で、sglはシーケンシャルな分類子予測を使い、pgmは確率的推論を使う。
本手法を4つの異なるソーシャルネットワークドメインに適用する。
EGGSは、ほとんどの実験的な設定において、特に正確なラベルが不確実な場合において、独立したモデルよりも正確である。
PGMの実装では、マルコフ論理ネットワークと確率的ソフトロジックを比較し、どちらもどちらよりもうまく機能し、SGLとPGMの組み合わせは、通常、単独でより優れた性能を発揮する。
関連論文リスト
- ExplainableDetector: Exploring Transformer-based Language Modeling Approach for SMS Spam Detection with Explainability Analysis [2.849988619791745]
近年、SMSスパムの数は大幅に増加している。
SMSデータの非構造化フォーマットは、SMSスパム検出に重大な課題をもたらす。
我々は、スパムメッセージ検出の問題を解決するために、最適化および微調整された変換器ベース大規模言語モデル(LLM)を用いる。
論文 参考訳(メタデータ) (2024-05-12T11:42:05Z) - SpamDam: Towards Privacy-Preserving and Adversary-Resistant SMS Spam Detection [2.0355793807035094]
SpamDamはSMSスパムの検出と理解において重要な課題を克服するために設計されたSMSスパム検出フレームワークである。
われわれは2018年から2023年にかけて、TwitterとWeiboから76万件以上のSMSスパムメッセージを収集した。
我々は、SMSスパム検出モデルの対角的堅牢性を厳格に検証し、新しいリバースバックドア攻撃を導入した。
論文 参考訳(メタデータ) (2024-04-15T06:07:10Z) - Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - Learning Multiplex Representations on Text-Attributed Graphs with One Language Model Encoder [55.24276913049635]
テキスト分散グラフ上での多重表現学習のための新しいフレームワークMETAGを提案する。
既存の手法とは対照的に、MeTAGは1つのテキストエンコーダを使用して関係性間の共有知識をモデル化する。
学術分野と電子商取引分野の5つのグラフにおいて,9つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2023-10-10T14:59:22Z) - SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for
Generative Large Language Models [55.60306377044225]
「SelfCheckGPT」は、ブラックボックスモデルの応答をファクトチェックする単純なサンプリングベースアプローチである。
本稿では,GPT-3を用いてWikiBioデータセットから個人に関するパスを生成する手法について検討する。
論文 参考訳(メタデータ) (2023-03-15T19:31:21Z) - Building an Effective Email Spam Classification Model with spaCy [0.0]
著者はPythonプログラミング言語のspurCy自然言語処理ライブラリと3つの機械学習(ML)アルゴリズムを使用して、Gmailサービスから収集されたスパムメールを検出する。
論文 参考訳(メタデータ) (2023-03-15T17:41:11Z) - Stacked Hybrid-Attention and Group Collaborative Learning for Unbiased
Scene Graph Generation [62.96628432641806]
Scene Graph Generationは、まず与えられた画像内の視覚的コンテンツをエンコードし、次にそれらをコンパクトな要約グラフに解析することを目的としている。
まず,モーダル内改良とモーダル間相互作用を容易にする新しいスタック型ハイブリッド・アテンションネットワークを提案する。
次に、デコーダを最適化するための革新的なグループ協調学習戦略を考案する。
論文 参考訳(メタデータ) (2022-03-18T09:14:13Z) - Privatized Graph Federated Learning [57.14673504239551]
グラフによって連結された複数の単位からなるグラフフェデレーション学習を導入する。
グラフ準同型摂動はアルゴリズムが微分プライベートであることを保証するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2022-03-14T13:48:23Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Privacy-Preserving Spam Filtering using Functional Encryption [1.0019926246026924]
我々は,暗号化メールの分類を可能にするスパム分類フレームワークを構築した。
本モデルは,2層ネットワーク部と多層知覚ネットワーク部を有するニューラルネットワークに基づく。
実世界のスパムデータセットの評価結果は,提案したスパム分類モデルが96%以上の精度を達成していることを示している。
論文 参考訳(メタデータ) (2020-12-08T02:14:28Z) - Classification of Spam Emails through Hierarchical Clustering and
Supervised Learning [1.8065361710947976]
本稿では,すでに検出されているスパムメールのハンドリングを改善するために,スパムメールをカテゴリに分類することを提案する。
マルチクラスのスパム分類のタスクでは、TF-IDFをSVMと組み合わせて最高のマイクロF1スコア、95.39%ドル、および(ii)TD-IDFをNBと組み合わせて最速のスパム分類を行い、電子メールを2.13$msで分析する。
論文 参考訳(メタデータ) (2020-05-18T14:41:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。