Fugu-MT 論文翻訳(概要): Building an Effective Email Spam Classification Model with spaCy

論文の概要: Building an Effective Email Spam Classification Model with spaCy

arxiv url: http://arxiv.org/abs/2303.08792v1
Date: Wed, 15 Mar 2023 17:41:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-16 12:43:52.036879
Title: Building an Effective Email Spam Classification Model with spaCy
Title（参考訳）: SpaCyを用いた効果的なメールスパム分類モデルの構築
Authors: Kazem Taghandiki
Abstract要約: 著者はPythonプログラミング言語のspurCy自然言語処理ライブラリと3つの機械学習(ML)アルゴリズムを使用して、Gmailサービスから収集されたスパムメールを検出する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Today, people use email services such as Gmail, Outlook, AOL Mail, etc. to communicate with each other as quickly as possible to send information and official letters. Spam or junk mail is a major challenge to this type of communication, usually sent by botnets with the aim of advertising, harming and stealing information in bulk to different people. Receiving unwanted spam emails on a daily basis fills up the inbox folder. Therefore, spam detection is a fundamental challenge, so far many works have been done to detect spam using clustering and text categorisation methods. In this article, the author has used the spaCy natural language processing library and 3 machine learning (ML) algorithms Naive Bayes (NB), Decision Tree C45 and Multilayer Perceptron (MLP) in the Python programming language to detect spam emails collected from the Gmail service. Observations show the accuracy rate (96%) of the Multilayer Perceptron (MLP) algorithm in spam detection.
Abstract（参考訳）: 今日では、Gmail、Outlook、AOL Mailなどのメールサービスを使って、できるだけ早く互いにコミュニケーションし、情報や公式の手紙を送ることができる。スパムメールやジャンクメールはこの種のコミュニケーションにとって大きな課題であり、通常はボットネットが広告や個人情報を大量に盗む目的で送っている。毎日不要なスパムメールを受け取ると、受信箱のフォルダーがいっぱいになる。したがって、スパム検出は基本的な課題であり、クラスタリングやテキスト分類手法を用いてスパムを検出するために多くの研究がなされている。本稿では,Pythonの自然言語処理ライブラリであるpaCyと3つの機械学習アルゴリズムであるNaive Bayes(NB),Decision Tree C45,Multilayer Perceptron(MLP)を用いて,Gmailサービスから収集したスパムメールを検出する。スパム検出における多層パーセプトロン(MLP)アルゴリズムの精度(96%)が観察された。

関連論文リスト

Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [65.27124213266491]
テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。 CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文参考訳（メタデータ） (2025-05-21T10:08:39Z)
Investigating the Effectiveness of Bayesian Spam Filters in Detecting LLM-modified Spam Mails [1.6298172960110866]
スパムとフィッシングは、サイバーセキュリティにおける重要な脅威であり、セキュリティインシデントの90%近くを担っている。これらの攻撃が高度化するにつれて、堅牢な防御機構の必要性が増す。 ChatGPTのような大規模言語モデル(LLM)の出現は、新しい課題を提示している。本研究は,LLM修正メールコンテンツに対するSpamAssassinの堅牢性と有効性を評価することを目的とする。
論文参考訳（メタデータ） (2024-08-26T14:25:30Z)
Prompted Contextual Vectors for Spear-Phishing Detection [45.07804966535239]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文参考訳（メタデータ） (2024-02-13T09:12:55Z)
SmoothLLM: Defending Large Language Models Against Jailbreaking Attacks [99.23352758320945]
SmoothLLMは,大規模言語モデル(LLM)に対するジェイルブレーキング攻撃を軽減するために設計された,最初のアルゴリズムである。敵が生成したプロンプトが文字レベルの変化に対して脆弱であることから、我々の防衛はまず、与えられた入力プロンプトの複数のコピーをランダムに摂動し、対応する予測を集約し、敵の入力を検出する。
論文参考訳（メタデータ） (2023-10-05T17:01:53Z)
Spam Detection Using BERT [0.0]
BERT事前学習モデルを用いてスパム検知器を構築し,そのコンテキストを理解することで電子メールやメッセージの分類を行う。スパム検出性能は98.62%,97.83%,99.13%,99.28%であった。
論文参考訳（メタデータ） (2022-06-06T09:09:40Z)
Anomaly Detection in Emails using Machine Learning and Header Information [0.0]
フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
論文参考訳（メタデータ） (2022-03-19T23:31:23Z)
Deep convolutional forest: a dynamic deep ensemble approach for spam detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文参考訳（メタデータ） (2021-10-10T17:19:37Z)
Robust and Verifiable Information Embedding Attacks to Deep Neural Networks via Error-Correcting Codes [81.85509264573948]
ディープラーニングの時代、ユーザは、サードパーティの機械学習ツールを使用して、ディープニューラルネットワーク(DNN)分類器をトレーニングすることが多い。情報埋め込み攻撃では、攻撃者は悪意のあるサードパーティの機械学習ツールを提供する。本研究では,一般的なポストプロセッシング手法に対して検証可能で堅牢な情報埋め込み攻撃を設計することを目的とする。
論文参考訳（メタデータ） (2020-10-26T17:42:42Z)
Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文参考訳（メタデータ） (2020-06-10T21:18:07Z)
Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文参考訳（メタデータ） (2020-05-26T23:41:05Z)
Classification of Spam Emails through Hierarchical Clustering and Supervised Learning [1.8065361710947976]
本稿では,すでに検出されているスパムメールのハンドリングを改善するために,スパムメールをカテゴリに分類することを提案する。マルチクラスのスパム分類のタスクでは、TF-IDFをSVMと組み合わせて最高のマイクロF1スコア、95.39%ドル、および(ii)TD-IDFをNBと組み合わせて最速のスパム分類を行い、電子メールを2.13$msで分析する。
論文参考訳（メタデータ） (2020-05-18T14:41:22Z)
DeepQuarantine for Suspicious Mail [0.0]
DeepQuarantine(DQ)は、潜在的なスパムメッセージを検出し、隔離するクラウド技術である。隔離されたメールのほとんどはスパムであり、クライアントは遅滞なくメールを使用できる。
論文参考訳（メタデータ） (2020-01-13T11:32:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。