論文の概要: Anomaly Detection in Emails using Machine Learning and Header
Information
- arxiv url: http://arxiv.org/abs/2203.10408v1
- Date: Sat, 19 Mar 2022 23:31:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-26 14:56:53.930092
- Title: Anomaly Detection in Emails using Machine Learning and Header
Information
- Title(参考訳): 機械学習とヘッダ情報を用いた電子メールの異常検出
- Authors: Craig Beaman and Haruna Isah
- Abstract要約: フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。
本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomalies in emails such as phishing and spam present major security risks
such as the loss of privacy, money, and brand reputation to both individuals
and organizations. Previous studies on email anomaly detection relied on a
single type of anomaly and the analysis of the email body and subject content.
A drawback of this approach is that it takes into account the written language
of the email content. To overcome this deficit, this study conducted feature
extraction and selection on email header datasets and leveraged both multi and
one-class anomaly detection approaches. Experimental analysis results obtained
demonstrate that email header information only is enough to reliably detect
spam and phishing emails. Supervised learning algorithms such as Random Forest,
SVM, MLP, KNN, and their stacked ensembles were found to be very successful,
achieving high accuracy scores of 97% for phishing and 99% for spam emails.
One-class classification with One-Class SVM achieved accuracy scores of 87% and
89% with spam and phishing emails, respectively. Real-world email filtering
applications will benefit from the use of only the header information in terms
of resources utilization and efficiency.
- Abstract(参考訳): フィッシングやスパムのようなメールの異常は、個人と組織の両方にプライバシー、お金、ブランドの評判を失うなど、大きなセキュリティリスクをもたらしている。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と対象内容の分析に頼っていた。
このアプローチの欠点は、メールコンテンツの書かれた言語を考慮に入れることだ。
この欠点を克服するため、メールヘッダーデータセットの特徴抽出と選択を行い、マルチクラスおよびワンクラスの異常検出アプローチを利用した。
その結果,メールヘッダ情報だけでスパムやフィッシングメールを確実に検出できることが実証された。
Random Forest, SVM, MLP, KNNなどの教師あり学習アルゴリズムとその積み重ねアンサンブルは非常に成功し、フィッシングでは97%、スパムメールでは99%という高い精度のスコアが得られた。
1クラスsvmによる1クラス分類では,スパムメールとフィッシングメールで87%,89%の精度スコアを得た。
実世界のメールフィルタリングアプリケーションは、リソースの利用と効率の点でヘッダ情報のみを使用することで恩恵を受ける。
関連論文リスト
- Exploring Content Concealment in Email [0.48748194765816943]
現代のメールフィルターは、悪意のあるメールに対する防御メカニズムの1つであり、しばしば高度な攻撃者によって回避される。
本研究は,攻撃者がメール中のHTMLとCSSを利用して任意のコンテンツを隠蔽する方法に焦点を当てる。
この隠されたコンテンツは、受信者によって検出されず、深刻なセキュリティリスクが生じる。
論文 参考訳(メタデータ) (2024-10-15T01:12:47Z) - ChatSpamDetector: Leveraging Large Language Models for Effective Phishing Email Detection [2.3999111269325266]
本研究では,大規模な言語モデル(LLM)を用いてフィッシングメールを検出するシステムChatSpamDetectorを紹介する。
LLM解析に適したプロンプトに電子メールデータを変換することにより、電子メールがフィッシングされているか否かを高精度に判定する。
総合的なフィッシングメールデータセットを用いて評価を行い,複数のLLMおよびベースラインシステムと比較した。
論文 参考訳(メタデータ) (2024-02-28T06:28:15Z) - Prompted Contextual Vectors for Spear-Phishing Detection [45.07804966535239]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文 参考訳(メタデータ) (2024-02-13T09:12:55Z) - Building an Effective Email Spam Classification Model with spaCy [0.0]
著者はPythonプログラミング言語のspurCy自然言語処理ライブラリと3つの機械学習(ML)アルゴリズムを使用して、Gmailサービスから収集されたスパムメールを検出する。
論文 参考訳(メタデータ) (2023-03-15T17:41:11Z) - Profiler: Profile-Based Model to Detect Phishing Emails [15.109679047753355]
本稿では,攻撃者がメールに適応して検出を回避できる可能性を低減するために,メールの多次元リスク評価を提案する。
本研究では,(1)脅威レベル,(2)認知的操作,(3)電子メールタイプを分析する3つのモデルを含むリスクアセスメントフレームワークを開発する。
プロファイラは、MLアプローチと併用して、誤分類を減らしたり、トレーニング段階で大規模な電子メールデータセットのラベル付けとして使用することができる。
論文 参考訳(メタデータ) (2022-08-18T10:01:55Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Phishing Detection through Email Embeddings [2.099922236065961]
機械学習技術によるフィッシングメール検出の問題点は文献で広く議論されている。
本稿では,電子メールの埋め込みによってこれらの手がかりが捉えられるか無視されるかを調べるために,同様の指標を用いたフィッシングと正当性メールのセットを構築した。
以上の結果から,eメール埋め込み手法は,メールをフィッシングあるいは正当に分類するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-12-28T21:16:41Z) - Detection of Adversarial Supports in Few-shot Classifiers Using Feature
Preserving Autoencoders and Self-Similarity [89.26308254637702]
敵対的なサポートセットを強調するための検出戦略を提案する。
我々は,特徴保存型オートエンコーダフィルタリングと,この検出を行うサポートセットの自己相似性の概念を利用する。
提案手法は攻撃非依存であり, 最善の知識まで, 数発分類器の検出を探索する最初の方法である。
論文 参考訳(メタデータ) (2020-12-09T14:13:41Z) - Active Learning from Crowd in Document Screening [76.9545252341746]
我々は、文書を評価し、それらを効率的にスクリーニングする機械学習分類器のセットの構築に注力する。
そこで本研究では,多ラベル能動学習スクリーニング技術である目的認識サンプリングを提案する。
目的認識サンプリングは,アートアクティブラーニングサンプリングの手法を著しく上回っていることを実証する。
論文 参考訳(メタデータ) (2020-11-11T16:17:28Z) - Robust and Verifiable Information Embedding Attacks to Deep Neural
Networks via Error-Correcting Codes [81.85509264573948]
ディープラーニングの時代、ユーザは、サードパーティの機械学習ツールを使用して、ディープニューラルネットワーク(DNN)分類器をトレーニングすることが多い。
情報埋め込み攻撃では、攻撃者は悪意のあるサードパーティの機械学習ツールを提供する。
本研究では,一般的なポストプロセッシング手法に対して検証可能で堅牢な情報埋め込み攻撃を設計することを目的とする。
論文 参考訳(メタデータ) (2020-10-26T17:42:42Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。