論文の概要: Explainable Transformer-Based Email Phishing Classification with Adversarial Robustness
- arxiv url: http://arxiv.org/abs/2511.12085v1
- Date: Sat, 15 Nov 2025 08:05:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.598049
- Title: Explainable Transformer-Based Email Phishing Classification with Adversarial Robustness
- Title(参考訳): 逆ロバスト性を考慮した説明可能なトランスフォーマーによる電子メールフィッシング分類
- Authors: Sajad U P,
- Abstract要約: フィッシングと関連するサイバー脅威は、より多様で技術的に進んでいる。
最近の脅威、特に人工知能(AI)によるフィッシング攻撃は、フィッシング検出器のシステム全体のレジリエンスを低下させている。
本研究では,メール分類におけるBERT変換モデルの小型,高速,軽量バージョンであるDistilBERTを用いたハイブリッド手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing and related cyber threats are becoming more varied and technologically advanced. Among these, email-based phishing remains the most dominant and persistent threat. These attacks exploit human vulnerabilities to disseminate malware or gain unauthorized access to sensitive information. Deep learning (DL) models, particularly transformer-based models, have significantly enhanced phishing mitigation through their contextual understanding of language. However, some recent threats, specifically Artificial Intelligence (AI)-generated phishing attacks, are reducing the overall system resilience of phishing detectors. In response, adversarial training has shown promise against AI-generated phishing threats. This study presents a hybrid approach that uses DistilBERT, a smaller, faster, and lighter version of the BERT transformer model for email classification. Robustness against text-based adversarial perturbations is reinforced using Fast Gradient Method (FGM) adversarial training. Furthermore, the framework integrates the LIME Explainable AI (XAI) technique to enhance the transparency of the DistilBERT architecture. The framework also uses the Flan-T5-small language model from Hugging Face to generate plain-language security narrative explanations for end-users. This combined approach ensures precise phishing classification while providing easily understandable justifications for the model's decisions.
- Abstract(参考訳): フィッシングと関連するサイバー脅威は、より多様で技術的に進んでいる。
メールベースのフィッシングは依然として最も支配的かつ永続的な脅威である。
これらの攻撃は人間の脆弱性を利用してマルウェアを拡散したり、機密情報への不正アクセスを得る。
ディープラーニング(DL)モデル、特にトランスフォーマーベースモデルは、文脈的言語理解を通じてフィッシング緩和を大幅に強化した。
しかし、最近の脅威、特に人工知能(AI)によるフィッシング攻撃は、フィッシング検出器のシステム全体のレジリエンスを低下させている。
これに対し、敵の訓練はAIが生み出すフィッシングの脅威に対する約束を示している。
本研究では,メール分類におけるBERT変換モデルの小型,高速,軽量バージョンであるDistilBERTを用いたハイブリッド手法を提案する。
テキストベース対向摂動に対するロバスト性は、FGM(Fast Gradient Method)対向トレーニングを用いて強化される。
さらに、このフレームワークはLIME Explainable AI(XAI)技術を統合し、DistilBERTアーキテクチャの透明性を高める。
フレームワークはまた、Hugging FaceのFlan-T5-small言語モデルを使用して、エンドユーザのための平易なセキュリティ説明を生成する。
この組み合わせのアプローチは、モデルの判断に対する理解しやすい正当化を提供しながら、正確なフィッシング分類を保証する。
関連論文リスト
- Robust ML-based Detection of Conventional, LLM-Generated, and Adversarial Phishing Emails Using Advanced Text Preprocessing [3.3166006294048427]
テキスト前処理パイプラインを拡張したロバストなフィッシングメール検出システムを提案する。
提案手法は,広く採用されている自然言語処理(NLP)の特徴抽出技術と機械学習アルゴリズムを統合する。
フィッシングと正規のEメールの両方からなる公開データセット上で、我々のモデルを評価し、検出精度94.26%、F1スコア84.39%を達成した。
論文 参考訳(メタデータ) (2025-10-13T20:34:19Z) - SoK: Large Language Model-Generated Textual Phishing Campaigns End-to-End Analysis of Generation, Characteristics, and Detection [3.7549350220109274]
大規模言語モデル(LLM)は、数分で大規模なPhishing-as-a-Service'攻撃を可能にする。
LLMによるフィッシング攻撃の研究が増えているにもかかわらず、フィッシング攻撃のライフサイクルに関する体系的な研究は依然として乏しい。
我々は,LLM生成フィッシングにおける知識の体系化(SoK)を行い,生成技術,攻撃特徴,緩和戦略にまたがるエンド・ツー・エンド分析を行う。
論文 参考訳(メタデータ) (2025-08-29T09:39:46Z) - EXPLICATE: Enhancing Phishing Detection through Explainable AI and LLM-Powered Interpretability [44.2907457629342]
EXPLICATEは、三成分アーキテクチャによるフィッシング検出を強化するフレームワークである。
既存のディープラーニング技術と同等ですが、説明性が向上しています。
自動AIとフィッシング検出システムにおけるユーザ信頼の重大な隔たりに対処する。
論文 参考訳(メタデータ) (2025-03-22T23:37:35Z) - Reformulation is All You Need: Addressing Malicious Text Features in DNNs [53.45564571192014]
本稿では,敵攻撃とバックドア攻撃の両方に対して有効な,統一的かつ適応的な防御フレームワークを提案する。
我々のフレームワークは、様々な悪意あるテキスト機能において、既存のサンプル指向の防御基準よりも優れています。
論文 参考訳(メタデータ) (2025-02-02T03:39:43Z) - PEEK: Phishing Evolution Framework for Phishing Generation and Evolving Pattern Analysis using Large Language Models [10.455333111937598]
フィッシングはいまだに広範囲にわたるサイバー脅威であり、攻撃者は詐欺メールを使って被害者を誘惑し、機密情報を暴露している。
深層学習はフィッシング攻撃に対する防御において重要な要素となっているが、これらのアプローチは重大な制限に直面している。
フィッシングメールデータセットの質と多様性を向上するためのPEEK(Phishing Evolution FramEworK)を提案する。
論文 参考訳(メタデータ) (2024-11-18T09:03:51Z) - CTINexus: Automatic Cyber Threat Intelligence Knowledge Graph Construction Using Large Language Models [49.657358248788945]
サイバー脅威インテリジェンス(CTI)レポートのテキスト記述は、サイバー脅威に関する豊富な知識源である。
現在のCTI知識抽出法は柔軟性と一般化性に欠ける。
我々は,データ効率の高いCTI知識抽出と高品質サイバーセキュリティ知識グラフ(CSKG)構築のための新しいフレームワークであるCTINexusを提案する。
論文 参考訳(メタデータ) (2024-10-28T14:18:32Z) - Defending Large Language Models against Jailbreak Attacks via Semantic
Smoothing [107.97160023681184]
適応型大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対して脆弱である。
提案するSEMANTICSMOOTHは,与えられた入力プロンプトのセマンティック変換されたコピーの予測を集約するスムージングベースのディフェンスである。
論文 参考訳(メタデータ) (2024-02-25T20:36:03Z) - An Explainable Transformer-based Model for Phishing Email Detection: A Large Language Model Approach [2.1301560294088318]
フィッシングメール(英: Phishing email)は、機密情報を盗んだり、金銭的損害を与える目的で偽のメールを送ることによって、ユーザーを騙そうとする深刻なサイバー脅威である。
大規模な学術研究にもかかわらず、フィッシング検出はサイバーセキュリティの分野で今も進行中で恐ろしい課題である。
フィッシングメールの検出のために最適化された微調整変換器を用いた DistilBERT モデルを提案する。
論文 参考訳(メタデータ) (2024-02-21T15:23:21Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。