論文の概要: MultiPhishGuard: An LLM-based Multi-Agent System for Phishing Email Detection
- arxiv url: http://arxiv.org/abs/2505.23803v1
- Date: Mon, 26 May 2025 23:27:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.516777
- Title: MultiPhishGuard: An LLM-based Multi-Agent System for Phishing Email Detection
- Title(参考訳): MultiPhishGuard: フィッシングメール検出のためのLLMベースのマルチエージェントシステム
- Authors: Yinuo Xue, Eric Spero, Yun Sing Koh, Giovanni Russello,
- Abstract要約: MultiPhishGuardは動的マルチエージェント検出システムである。
本フレームワークでは, 政策最適化強化学習アルゴリズムを用いて, 自動決定重み付けを行う5つの協調エージェントを用いる。
実験により、MultiPhishGuardは偽陽性(2.73%)と偽陰性率(0.20%)で高い精度(97.89%)を達成することが示された。
- 参考スコア(独自算出の注目度): 3.187381965457262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing email detection faces critical challenges from evolving adversarial tactics and heterogeneous attack patterns. Traditional detection methods, such as rule-based filters and denylists, often struggle to keep pace with these evolving tactics, leading to false negatives and compromised security. While machine learning approaches have improved detection accuracy, they still face challenges adapting to novel phishing strategies. We present MultiPhishGuard, a dynamic LLM-based multi-agent detection system that synergizes specialized expertise with adversarial-aware reinforcement learning. Our framework employs five cooperative agents (text, URL, metadata, explanation simplifier, and adversarial agents) with automatically adjusted decision weights powered by a Proximal Policy Optimization reinforcement learning algorithm. To address emerging threats, we introduce an adversarial training loop featuring an adversarial agent that generates subtle context-aware email variants, creating a self-improving defense ecosystem and enhancing system robustness. Experimental evaluations on public datasets demonstrate that MultiPhishGuard significantly outperforms Chain-of-Thoughts, single-agent baselines and state-of-the-art detectors, as validated by ablation studies and comparative analyses. Experiments demonstrate that MultiPhishGuard achieves high accuracy (97.89\%) with low false positive (2.73\%) and false negative rates (0.20\%). Additionally, we incorporate an explanation simplifier agent, which provides users with clear and easily understandable explanations for why an email is classified as phishing or legitimate. This work advances phishing defense through dynamic multi-agent collaboration and generative adversarial resilience.
- Abstract(参考訳): フィッシングメール検出は、敵の戦術と異種攻撃パターンの進化による重要な課題に直面している。
ルールベースのフィルタやデファクトリストのような従来の検出方法は、しばしばこれらの進化した戦術に追従するのに苦労し、誤った否定とセキュリティを損なう。
機械学習のアプローチは検出精度を改善したが、新しいフィッシング戦略に適応する上ではまだ課題に直面している。
本稿では,LLMに基づく動的マルチエージェント検出システムであるMultiPhishGuardについて述べる。
本フレームワークでは, 協調エージェント(テキスト, URL, メタデータ, 説明単純化エージェント, 敵エージェント)を5つ採用し, 最適化強化学習アルゴリズムによる決定重みの自動調整を行う。
新たな脅威に対処するために、敵エージェントを特徴とする敵訓練ループを導入し、微妙な文脈認識型電子メールの変種を生成し、自己改善型防衛エコシステムを作成し、システムの堅牢性を高める。
公開データセットに対する実験的評価は、MultiPhishGuardが、アブレーション研究や比較分析によって検証されたように、Chain-of-Thoughts, single-agent baselines, state-of-the-art detectorsを著しく上回っていることを示している。
実験により、MultiPhishGuardは偽陽性(2.73\%)と偽陰性率(0.20\%)で高い精度(97.89\%)を達成することが示された。
さらに,メールをフィッシングや合法に分類する理由について,ユーザが明確かつ理解しやすい説明を提供する説明簡略化エージェントを組み込んだ。
この研究は、動的マルチエージェント協調と生成的敵レジリエンスによるフィッシング防御を前進させる。
関連論文リスト
- Debate-Driven Multi-Agent LLMs for Phishing Email Detection [0.0]
エージェント間の偽りの議論をシミュレートしてフィッシングメールを検出する多エージェント大規模言語モデル(LLM)を提案する。
提案手法では,2つの LLM エージェントを用いて,最終判断を代弁する判断エージェントを用いて,分類課題の論拠を提示する。
結果は、議論の構造自体が、余分なプロンプト戦略を伴わずに正確な決定を下すのに十分であることを示している。
論文 参考訳(メタデータ) (2025-03-27T23:18:14Z) - PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.106113544525545]
フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な制限に直面している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文 参考訳(メタデータ) (2024-08-20T11:14:21Z) - Efficient Adversarial Training in LLMs with Continuous Attacks [99.5882845458567]
大規模言語モデル(LLM)は、安全ガードレールをバイパスできる敵攻撃に対して脆弱である。
本稿では,2つの損失からなる高速対向訓練アルゴリズム(C-AdvUL)を提案する。
C-AdvIPOは、対向的に堅牢なアライメントのためのユーティリティデータを必要としない、対向型のIPOである。
論文 参考訳(メタデータ) (2024-05-24T14:20:09Z) - Deep Learning-Based Speech and Vision Synthesis to Improve Phishing
Attack Detection through a Multi-layer Adaptive Framework [1.3353802999735709]
現在のアンチフィッシング法は、攻撃者が採用する高度化戦略のために、複雑なフィッシングに対して脆弱なままである。
本研究では,Deep LearningとRandon Forestを組み合わせて,画像の読み上げ,ディープフェイクビデオからの音声合成,自然言語処理を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-27T06:47:52Z) - BadCLIP: Dual-Embedding Guided Backdoor Attack on Multimodal Contrastive
Learning [85.2564206440109]
本報告では,防衛後においてもバックドア攻撃が有効であり続けるという現実的なシナリオにおける脅威を明らかにする。
バックドア検出や細調整防御のモデル化に抵抗性のあるemphtoolnsアタックを導入する。
論文 参考訳(メタデータ) (2023-11-20T02:21:49Z) - Illusory Attacks: Information-Theoretic Detectability Matters in Adversarial Attacks [76.35478518372692]
エプシロン・イリューソリー(epsilon-illusory)は、シーケンシャルな意思決定者に対する敵対的攻撃の新たな形態である。
既存の攻撃と比較して,エプシロン・イリューソリーの自動検出は極めて困難である。
以上の結果から, より優れた異常検知器, 効果的なハードウェアおよびシステムレベルの防御の必要性が示唆された。
論文 参考訳(メタデータ) (2022-07-20T19:49:09Z) - Model-Agnostic Meta-Attack: Towards Reliable Evaluation of Adversarial
Robustness [53.094682754683255]
モデル非依存型メタアタック(MAMA)アプローチにより,より強力な攻撃アルゴリズムを自動検出する。
本手法は、繰り返しニューラルネットワークによってパラメータ化された逆攻撃を学習する。
本研究では,未知の防御を攻撃した場合の学習能力を向上させるために,モデルに依存しない訓練アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-13T13:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。