論文の概要: Effective Email Spam Detection System using Extreme Gradient Boosting
- arxiv url: http://arxiv.org/abs/2012.14430v1
- Date: Sun, 27 Dec 2020 15:23:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-24 21:15:46.295553
- Title: Effective Email Spam Detection System using Extreme Gradient Boosting
- Title(参考訳): 極度勾配ブースティングを用いたメールスパム検出システム
- Authors: Ismail B. Mustapha, Shafaatunnur Hasan, Sunday O. Olatunji, Siti
Mariyam Shamsuddin, Afolabi Kazeem
- Abstract要約: 本研究は, Extreme Gradient Boosting(XGBoost)に基づくスパム検出モデルの改良である。
実験結果は、提案されたモデルは、評価指標の広い範囲にまたがる以前のアプローチを上回っていることを示している。
- 参考スコア(独自算出の注目度): 1.8899300124593645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The popularity, cost-effectiveness and ease of information exchange that
electronic mails offer to electronic device users has been plagued with the
rising number of unsolicited or spam emails. Driven by the need to protect
email users from this growing menace, research in spam email
filtering/detection systems has being increasingly active in the last decade.
However, the adaptive nature of spam emails has often rendered most of these
systems ineffective. While several spam detection models have been reported in
literature, the reported performance on an out of sample test data shows the
room for more improvement. Presented in this research is an improved spam
detection model based on Extreme Gradient Boosting (XGBoost) which to the best
of our knowledge has received little attention spam email detection problems.
Experimental results show that the proposed model outperforms earlier
approaches across a wide range of evaluation metrics. A thorough analysis of
the model results in comparison to the results of earlier works is also
presented.
- Abstract(参考訳): 電子メールが電子デバイスユーザーに提供している人気、費用効果、情報交換の容易さは、迷惑メールやスパムメールの増加に苦しめられている。
スパムメールのフィルタリング/検出システムの研究は、この10年でますます活発になっている。
しかし、スパムメールの適応性はしばしばこれらのシステムの大半を非効率にしている。
いくつかのスパム検出モデルが文献で報告されているが、サンプルデータのアウトオブサンプルのパフォーマンスは、さらなる改善の余地を示している。
本研究で提示されたスパム検出モデルでは,スパム検出問題にほとんど注意を払わなかったxgboost(extremegradient boosting)に基づいたスパム検出モデルが改善されている。
実験結果から,提案手法は様々な評価指標において,従来の手法よりも優れていることがわかった。
また,従来の研究結果と比較し,モデル結果の徹底的な分析を行った。
関連論文リスト
- Resultant: Incremental Effectiveness on Likelihood for Unsupervised Out-of-Distribution Detection [63.93728560200819]
unsupervised out-of-distribution (U-OOD) は、未表示のin-distriion(ID)データのみに基づいて訓練された検出器でデータサンプルを識別することである。
近年の研究は、DGMに基づく様々な検出器を開発し、可能性を超えて移動している。
本研究では,各方向,特にポストホック前とデータセットエントロピー・ミューチュアルキャリブレーションの2つの手法を適用した。
実験の結果、結果が新しい最先端のU-OOD検出器になる可能性が示された。
論文 参考訳(メタデータ) (2024-09-05T02:58:13Z) - Different Victims, Same Layout: Email Visual Similarity Detection for Enhanced Email Protection [0.3683202928838613]
我々は,電子メール脅威防御システムの検知能力を向上させるために,Pisco という名の電子メール視覚類似性検出手法を提案する。
以上の結果から,Eメールキットは広範囲に再利用され,視覚的に類似したメールが,さまざまな時間間隔で当社の顧客に送信されていることが明らかとなった。
論文 参考訳(メタデータ) (2024-08-29T23:51:51Z) - Investigating the Effectiveness of Bayesian Spam Filters in Detecting LLM-modified Spam Mails [1.6298172960110866]
スパムとフィッシングは、サイバーセキュリティにおける重要な脅威であり、セキュリティインシデントの90%近くを担っている。
これらの攻撃が高度化するにつれて、堅牢な防御機構の必要性が増す。
ChatGPTのような大規模言語モデル(LLM)の出現は、新しい課題を提示している。
本研究は,LLM修正メールコンテンツに対するSpamAssassinの堅牢性と有効性を評価することを目的とする。
論文 参考訳(メタデータ) (2024-08-26T14:25:30Z) - Prompted Contextual Vectors for Spear-Phishing Detection [45.07804966535239]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文 参考訳(メタデータ) (2024-02-13T09:12:55Z) - MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。
一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。
本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文 参考訳(メタデータ) (2023-03-26T21:12:36Z) - Profiler: Profile-Based Model to Detect Phishing Emails [15.109679047753355]
本稿では,攻撃者がメールに適応して検出を回避できる可能性を低減するために,メールの多次元リスク評価を提案する。
本研究では,(1)脅威レベル,(2)認知的操作,(3)電子メールタイプを分析する3つのモデルを含むリスクアセスメントフレームワークを開発する。
プロファイラは、MLアプローチと併用して、誤分類を減らしたり、トレーニング段階で大規模な電子メールデータセットのラベル付けとして使用することができる。
論文 参考訳(メタデータ) (2022-08-18T10:01:55Z) - Anomaly Detection in Emails using Machine Learning and Header
Information [0.0]
フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。
本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
論文 参考訳(メタデータ) (2022-03-19T23:31:23Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Robust Spammer Detection by Nash Reinforcement Learning [64.80986064630025]
我々は,スパマーとスパム検知器が互いに現実的な目標を競うミニマックスゲームを開発する。
提案アルゴリズムは,スパマーが混在するスパマーが実用目標を達成するのを確実に防止できる平衡検出器を確実に見つけることができることを示す。
論文 参考訳(メタデータ) (2020-06-10T21:18:07Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z) - DeepQuarantine for Suspicious Mail [0.0]
DeepQuarantine(DQ)は、潜在的なスパムメッセージを検出し、隔離するクラウド技術である。
隔離されたメールのほとんどはスパムであり、クライアントは遅滞なくメールを使用できる。
論文 参考訳(メタデータ) (2020-01-13T11:32:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。