論文の概要: Building an Effective Email Spam Classification Model with spaCy
- arxiv url: http://arxiv.org/abs/2303.08792v1
- Date: Wed, 15 Mar 2023 17:41:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 12:43:52.036879
- Title: Building an Effective Email Spam Classification Model with spaCy
- Title(参考訳): SpaCyを用いた効果的なメールスパム分類モデルの構築
- Authors: Kazem Taghandiki
- Abstract要約: 著者はPythonプログラミング言語のspurCy自然言語処理ライブラリと3つの機械学習(ML)アルゴリズムを使用して、Gmailサービスから収集されたスパムメールを検出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Today, people use email services such as Gmail, Outlook, AOL Mail, etc. to
communicate with each other as quickly as possible to send information and
official letters. Spam or junk mail is a major challenge to this type of
communication, usually sent by botnets with the aim of advertising, harming and
stealing information in bulk to different people. Receiving unwanted spam
emails on a daily basis fills up the inbox folder. Therefore, spam detection is
a fundamental challenge, so far many works have been done to detect spam using
clustering and text categorisation methods. In this article, the author has
used the spaCy natural language processing library and 3 machine learning (ML)
algorithms Naive Bayes (NB), Decision Tree C45 and Multilayer Perceptron (MLP)
in the Python programming language to detect spam emails collected from the
Gmail service. Observations show the accuracy rate (96%) of the Multilayer
Perceptron (MLP) algorithm in spam detection.
- Abstract(参考訳): 今日では、Gmail、Outlook、AOL Mailなどのメールサービスを使って、できるだけ早く互いにコミュニケーションし、情報や公式の手紙を送ることができる。
スパムメールやジャンクメールはこの種のコミュニケーションにとって大きな課題であり、通常はボットネットが広告や個人情報を大量に盗む目的で送っている。
毎日不要なスパムメールを受け取ると、受信箱のフォルダーがいっぱいになる。
したがって、スパム検出は基本的な課題であり、クラスタリングやテキスト分類手法を用いてスパムを検出するために多くの研究がなされている。
本稿では,Pythonの自然言語処理ライブラリであるpaCyと3つの機械学習アルゴリズムであるNaive Bayes(NB),Decision Tree C45,Multilayer Perceptron(MLP)を用いて,Gmailサービスから収集したスパムメールを検出する。
スパム検出における多層パーセプトロン(MLP)アルゴリズムの精度(96%)が観察された。
関連論文リスト
- Investigating the Effectiveness of Bayesian Spam Filters in Detecting LLM-modified Spam Mails [1.6298172960110866]
スパムとフィッシングは、サイバーセキュリティにおける重要な脅威であり、セキュリティインシデントの90%近くを担っている。
これらの攻撃が高度化するにつれて、堅牢な防御機構の必要性が増す。
ChatGPTのような大規模言語モデル(LLM)の出現は、新しい課題を提示している。
本研究は,LLM修正メールコンテンツに対するSpamAssassinの堅牢性と有効性を評価することを目的とする。
論文 参考訳(メタデータ) (2024-08-26T14:25:30Z) - Prompted Contextual Vectors for Spear-Phishing Detection [45.07804966535239]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文 参考訳(メタデータ) (2024-02-13T09:12:55Z) - SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks [99.23352758320945]
SmoothLLMは,大規模言語モデル(LLM)に対するジェイルブレーキング攻撃を軽減するために設計された,最初のアルゴリズムである。
敵が生成したプロンプトが文字レベルの変化に対して脆弱であることから、我々の防衛はまず、与えられた入力プロンプトの複数のコピーをランダムに摂動し、対応する予測を集約し、敵の入力を検出する。
論文 参考訳(メタデータ) (2023-10-05T17:01:53Z) - Spam Detection Using BERT [0.0]
BERT事前学習モデルを用いてスパム検知器を構築し,そのコンテキストを理解することで電子メールやメッセージの分類を行う。
スパム検出性能は98.62%,97.83%,99.13%,99.28%であった。
論文 参考訳(メタデータ) (2022-06-06T09:09:40Z) - Anomaly Detection in Emails using Machine Learning and Header
Information [0.0]
フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。
本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
論文 参考訳(メタデータ) (2022-03-19T23:31:23Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Robust and Verifiable Information Embedding Attacks to Deep Neural
Networks via Error-Correcting Codes [81.85509264573948]
ディープラーニングの時代、ユーザは、サードパーティの機械学習ツールを使用して、ディープニューラルネットワーク(DNN)分類器をトレーニングすることが多い。
情報埋め込み攻撃では、攻撃者は悪意のあるサードパーティの機械学習ツールを提供する。
本研究では,一般的なポストプロセッシング手法に対して検証可能で堅牢な情報埋め込み攻撃を設計することを目的とする。
論文 参考訳(メタデータ) (2020-10-26T17:42:42Z) - Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。
提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文 参考訳(メタデータ) (2020-06-10T21:18:07Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z) - Classification of Spam Emails through Hierarchical Clustering and
Supervised Learning [1.8065361710947976]
本稿では,すでに検出されているスパムメールのハンドリングを改善するために,スパムメールをカテゴリに分類することを提案する。
マルチクラスのスパム分類のタスクでは、TF-IDFをSVMと組み合わせて最高のマイクロF1スコア、95.39%ドル、および(ii)TD-IDFをNBと組み合わせて最速のスパム分類を行い、電子メールを2.13$msで分析する。
論文 参考訳(メタデータ) (2020-05-18T14:41:22Z) - DeepQuarantine for Suspicious Mail [0.0]
DeepQuarantine(DQ)は、潜在的なスパムメッセージを検出し、隔離するクラウド技術である。
隔離されたメールのほとんどはスパムであり、クライアントは遅滞なくメールを使用できる。
論文 参考訳(メタデータ) (2020-01-13T11:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。