論文の概要: Constructing and Benchmarking: a Labeled Email Dataset for Text-Based Phishing and Spam Detection Framework
- arxiv url: http://arxiv.org/abs/2511.21448v1
- Date: Wed, 26 Nov 2025 14:40:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.146913
- Title: Constructing and Benchmarking: a Labeled Email Dataset for Text-Based Phishing and Spam Detection Framework
- Title(参考訳): テキストベースのフィッシングとスパム検出フレームワークのためのラベル付き電子メールデータセットの構築とベンチマーク
- Authors: Rebeka Toth, Tamas Bisztray, Richard Dubniczky,
- Abstract要約: 本研究では、フィッシング、スパム、正統なメッセージを含む包括的な電子メールデータセットを提案する。
各メールには、そのカテゴリ、感情的な魅力、権威、そして根底にあるモチベーションが注釈付けされている。
その結果、強いフィッシング検出能力が強調される一方で、スパムと正当な電子メールを区別する上での永続的な課題が浮かび上がっている。
- 参考スコア(独自算出の注目度): 0.37687375904925485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing and spam emails remain a major cybersecurity threat, with attackers increasingly leveraging Large Language Models (LLMs) to craft highly deceptive content. This study presents a comprehensive email dataset containing phishing, spam, and legitimate messages, explicitly distinguishing between human- and LLM-generated content. Each email is annotated with its category, emotional appeal (e.g., urgency, fear, authority), and underlying motivation (e.g., link-following, credential theft, financial fraud). We benchmark multiple LLMs on their ability to identify these emotional and motivational cues and select the most reliable model to annotate the full dataset. To evaluate classification robustness, emails were also rephrased using several LLMs while preserving meaning and intent. A state-of-the-art LLM was then assessed on its performance across both original and rephrased emails using expert-labeled ground truth. The results highlight strong phishing detection capabilities but reveal persistent challenges in distinguishing spam from legitimate emails. Our dataset and evaluation framework contribute to improving AI-assisted email security systems. To support open science, all code, templates, and resources are available on our project site.
- Abstract(参考訳): フィッシングやスパムメールはサイバーセキュリティの大きな脅威であり、攻撃者はLarge Language Models(LLMs)を活用して、非常に詐欺的なコンテンツを制作している。
本研究では、フィッシング、スパム、正統なメッセージを含む総合的な電子メールデータセットについて、人間とLLM生成したコンテンツを明確に区別する。
各メールには、そのカテゴリ、感情的な魅力(緊急性、恐怖、権威など)、そして根底にある動機(リンクフォロー、クレデンシャル盗難、金融詐欺など)が注記されている。
我々は、これらの感情的、動機的な手がかりを識別する能力について複数のLCMをベンチマークし、完全なデータセットを注釈付けするための最も信頼性の高いモデルを選択する。
分類ロバスト性を評価するため、意味と意図を保存しながら複数のLSMを用いて電子メールをリフレッシュした。
最先端のLLMは、専門家ラベルの土台真実を用いて、オリジナルのメールとリフレッシュされたメールの両方でその性能を評価した。
その結果、強いフィッシング検出能力が強調されるが、スパムと正統なメールを区別する上で、永続的な課題が浮かび上がっている。
我々のデータセットと評価フレームワークは、AI支援メールセキュリティシステムの改善に寄与する。
オープンサイエンスをサポートするために、すべてのコード、テンプレート、リソースがプロジェクトサイトで利用可能です。
関連論文リスト
- LLM-Powered Intent-Based Categorization of Phishing Emails [0.0]
本稿では,Large Language Models (LLMs) の実践的可能性について検討し,その意図に焦点をあててフィッシングメールを検出する。
LLMによって運用されている意図型分類を導入し、メールを異なるカテゴリに分類し、行動可能な脅威情報を生成する。
以上の結果から,既存のLCMではフィッシングメールの検出と分類が可能であることが示唆された。
論文 参考訳(メタデータ) (2025-06-17T09:21:55Z) - Idiosyncrasies in Large Language Models [54.26923012617675]
大規模言語モデル(LLM)における慣用句の公開と研究
LLM生成テキストへの微調整テキスト埋め込みモデルにより,優れた分類精度が得られることがわかった。
我々はLLMを審査員として利用し、各モデルの慣用句の詳細かつオープンな記述を生成する。
論文 参考訳(メタデータ) (2025-02-17T18:59:02Z) - ChatSpamDetector: Leveraging Large Language Models for Effective Phishing Email Detection [2.3999111269325266]
本研究では,大規模な言語モデル(LLM)を用いてフィッシングメールを検出するシステムChatSpamDetectorを紹介する。
LLM解析に適したプロンプトに電子メールデータを変換することにより、電子メールがフィッシングされているか否かを高精度に判定する。
総合的なフィッシングメールデータセットを用いて評価を行い,複数のLLMおよびベースラインシステムと比較した。
論文 参考訳(メタデータ) (2024-02-28T06:28:15Z) - Prompted Contextual Vectors for Spear-Phishing Detection [41.26408609344205]
スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文 参考訳(メタデータ) (2024-02-13T09:12:55Z) - Anomaly Detection in Emails using Machine Learning and Header
Information [0.0]
フィッシングやスパムなどのメールの異常は、大きなセキュリティリスクをもたらす。
メールの異常検出に関する従来の研究は、単一のタイプの異常と、メール本体と被写体の内容の分析に頼っていた。
本研究では,メールヘッダデータセットの特徴抽出と抽出を行い,複数クラスおよび一クラスの異常検出手法を利用した。
論文 参考訳(メタデータ) (2022-03-19T23:31:23Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Learning with Weak Supervision for Email Intent Detection [56.71599262462638]
本稿では,メールの意図を検出するために,ユーザアクションを弱い監視源として活用することを提案する。
メール意図識別のためのエンドツーエンドの堅牢なディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-05-26T23:41:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。