論文の概要: PhishDebate: An LLM-Based Multi-Agent Framework for Phishing Website Detection
- arxiv url: http://arxiv.org/abs/2506.15656v1
- Date: Wed, 18 Jun 2025 17:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.76489
- Title: PhishDebate: An LLM-Based Multi-Agent Framework for Phishing Website Detection
- Title(参考訳): PhishDebate: フィッシングWebサイト検出のためのLLMベースのマルチエージェントフレームワーク
- Authors: Wenhao Li, Selvakumar Manickam, Yung-wey Chong, Shankar Karuppayah,
- Abstract要約: PhishDebateは、フィッシングWebサイト検出のためのモジュール型マルチエージェントLLMベースの議論フレームワークである。
ウェブページの異なるテキストの側面を独立して分析するために、4つの専門エージェントを使用している。
実世界のフィッシングデータセット上で98.2%のリコールと98.2%のTrue Positive Rate(TPR)を達成する。
- 参考スコア(独自算出の注目度): 13.177607247367211
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phishing websites continue to pose a significant cybersecurity threat, often leveraging deceptive structures, brand impersonation, and social engineering tactics to evade detection. While recent advances in large language models (LLMs) have enabled improved phishing detection through contextual understanding, most existing approaches rely on single-agent classification facing the risks of hallucination and lack interpretability or robustness. To address these limitations, we propose PhishDebate, a modular multi-agent LLM-based debate framework for phishing website detection. PhishDebate employs four specialized agents to independently analyze different textual aspects of a webpage--URL structure, HTML composition, semantic content, and brand impersonation--under the coordination of a Moderator and a final Judge. Through structured debate and divergent thinking, the framework delivers more accurate and interpretable decisions. Extensive evaluations on commercial LLMs demonstrate that PhishDebate achieves 98.2% recall and 98.2% True Positive Rate (TPR) on a real-world phishing dataset, and outperforms single-agent and Chain of Thought (CoT) baselines. Additionally, its modular design allows agent-level configurability, enabling adaptation to varying resource and application requirements.
- Abstract(参考訳): フィッシングサイトは、しばしば偽造構造、ブランドの偽造、そして検出を避けるためのソーシャルエンジニアリング戦術を活用する、重大なサイバーセキュリティの脅威を呈し続けている。
大規模言語モデル(LLM)の最近の進歩は、文脈理解によるフィッシング検出の改善を可能にしているが、既存のアプローチのほとんどは、幻覚のリスクに直面し、解釈可能性や堅牢性に欠ける単一エージェント分類に依存している。
これらの制約に対処するため,フィッシングWebサイト検出のためのモジュール型マルチエージェント LLM ベースの議論フレームワークである PhishDebate を提案する。
PhishDebateは、モデレーターと最終審査員の調整の下で、Webページの構造、HTML構成、セマンティックコンテンツ、ブランドの偽造など、異なるテキストの側面を独立して分析するために、4つの専門的なエージェントを使用している。
構造化された議論と異なる思考を通じて、このフレームワークはより正確で解釈可能な決定をもたらす。
商業LLMの大規模な評価は、PhishDebateが現実世界のフィッシングデータセット上で98.2%のリコールと98.2%のTrue Positive Rate(TPR)を達成し、シングルエージェントとChain of Thought(CoT)ベースラインを上回っていることを示している。
さらに、モジュール設計によりエージェントレベルの設定が可能となり、リソースやアプリケーション要件への適応が可能になる。
関連論文リスト
- MultiPhishGuard: An LLM-based Multi-Agent System for Phishing Email Detection [3.187381965457262]
MultiPhishGuardは動的マルチエージェント検出システムである。
本フレームワークでは, 政策最適化強化学習アルゴリズムを用いて, 自動決定重み付けを行う5つの協調エージェントを用いる。
実験により、MultiPhishGuardは偽陽性(2.73%)と偽陰性率(0.20%)で高い精度(97.89%)を達成することが示された。
論文 参考訳(メタデータ) (2025-05-26T23:27:15Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [74.82886755416949]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - A Trustworthy Multi-LLM Network: Challenges,Solutions, and A Use Case [59.58213261128626]
複数の大規模言語モデル(LLM)を信頼性のあるマルチLLMネットワーク(MultiLLMN)に接続するブロックチェーン対応協調フレームワークを提案する。
このアーキテクチャは、複雑なネットワーク最適化問題に対する最も信頼性が高く高品質な応答の協調評価と選択を可能にする。
論文 参考訳(メタデータ) (2025-05-06T05:32:46Z) - Debate-Driven Multi-Agent LLMs for Phishing Email Detection [0.0]
エージェント間の偽りの議論をシミュレートしてフィッシングメールを検出する多エージェント大規模言語モデル(LLM)を提案する。
提案手法では,2つの LLM エージェントを用いて,最終判断を代弁する判断エージェントを用いて,分類課題の論拠を提示する。
結果は、議論の構造自体が、余分なプロンプト戦略を伴わずに正確な決定を下すのに十分であることを示している。
論文 参考訳(メタデータ) (2025-03-27T23:18:14Z) - MIRAGE: Multimodal Immersive Reasoning and Guided Exploration for Red-Team Jailbreak Attacks [85.3303135160762]
MIRAGEは、物語駆動型コンテキストとロール没入を利用して、マルチモーダル大規模言語モデルにおける安全性メカニズムを回避する新しいフレームワークである。
最先端のパフォーマンスを達成し、最高のベースラインよりも攻撃成功率を最大17.5%向上させる。
役割の浸漬と構造的セマンティック再構築は、モデル固有のバイアスを活性化し、モデルが倫理的保護に自発的に違反することを実証する。
論文 参考訳(メタデータ) (2025-03-24T20:38:42Z) - Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models [53.580928907886324]
Reasoning-Augmented Conversationは、新しいマルチターンジェイルブレイクフレームワークである。
有害なクエリを良心的な推論タスクに再構成する。
RACEは,複雑な会話シナリオにおいて,最先端攻撃の有効性を実現する。
論文 参考訳(メタデータ) (2025-02-16T09:27:44Z) - PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.106113544525545]
フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な制限に直面している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文 参考訳(メタデータ) (2024-08-20T11:14:21Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。