論文の概要: CLASP: Cost-Optimized LLM-based Agentic System for Phishing Detection
- arxiv url: http://arxiv.org/abs/2510.18585v1
- Date: Tue, 21 Oct 2025 12:38:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.526205
- Title: CLASP: Cost-Optimized LLM-based Agentic System for Phishing Detection
- Title(参考訳): CLASP:Phishing Detectionのためのコスト最適化LDMエージェントシステム
- Authors: Fouad Trad, Ali Chehab,
- Abstract要約: 本稿では,複数の知的エージェントを活用することにより,フィッシングサイトを効果的に識別する新しいシステムであるCLASPを提案する。
システムはURLまたはQRコードを処理し、URL構造、Webページのスクリーンショット、HTMLコンテンツを評価する特殊なLCMベースのエージェントを使用する。
CLASPは、収集されたデータセットのフィッシング検出のためのF1スコアを40%以上向上し、F1スコアを20%改善した。
- 参考スコア(独自算出の注目度): 0.8737375836744933
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing websites remain a significant cybersecurity threat, necessitating accurate and cost-effective detection mechanisms. In this paper, we present CLASP, a novel system that effectively identifies phishing websites by leveraging multiple intelligent agents, built using large language models (LLMs), to analyze different aspects of a web resource. The system processes URLs or QR codes, employing specialized LLM-based agents that evaluate the URL structure, webpage screenshot, and HTML content to predict potential phishing threats. To optimize performance while minimizing operational costs, we experimented with multiple combination strategies for agent-based analysis, ultimately designing a strategic combination that ensures the per-website evaluation expense remains minimal without compromising detection accuracy. We tested various LLMs, including Gemini 1.5 Flash and GPT-4o mini, to build these agents and found that Gemini 1.5 Flash achieved the best performance with an F1 score of 83.01% on a newly curated dataset. Also, the system maintained an average processing time of 2.78 seconds per website and an API cost of around $3.18 per 1,000 websites. Moreover, CLASP surpasses leading previous solutions, achieving over 40% higher recall and a 20% improvement in F1 score for phishing detection on the collected dataset. To support further research, we have made our dataset publicly available, supporting the development of more advanced phishing detection systems.
- Abstract(参考訳): フィッシングウェブサイトは依然として重要なサイバーセキュリティの脅威であり、正確で費用対効果の高い検出メカニズムを必要としている。
本稿では,大規模言語モデル(LLM)を用いて構築された複数の知的エージェントを活用して,フィッシングサイトを効果的に識別する新しいシステムであるCLASPについて述べる。
このシステムはURLまたはQRコードを処理し、URL構造、Webページのスクリーンショット、HTMLコンテンツを評価する特殊なLCMベースのエージェントを使用してフィッシングの脅威を予測する。
運用コストを最小化しながら性能を最適化するため,エージェントベース分析のための複数の組み合わせ戦略を実験し,最終的には検出精度を損なうことなく,Webサイト毎の評価コストを最小限に抑える戦略の組み合わせを設計した。
Gemini 1.5 Flash や GPT-4o mini など,さまざまな LLM をテストしてこれらのエージェントを構築し,新たにキュレートされたデータセットで 83.01% のスコアで,Gemini 1.5 Flash が最高のパフォーマンスを達成していることを確認した。
また、Webサイト毎の平均処理時間は2.78秒であり、APIコストは1000サイト当たり約3.18ドルであった。
さらに、CLASPは、収集されたデータセットのフィッシング検出のための40%以上のリコールと20%のF1スコアを達成することで、先進的なソリューションを超越している。
さらなる研究を支援するため、我々のデータセットを公開し、より高度なフィッシング検出システムの開発を支援した。
関連論文リスト
- FocusAgent: Simple Yet Effective Ways of Trimming the Large Context of Web Agents [76.12500510390439]
大規模言語モデル(LLM)を利用したWebエージェントは、ユーザの目標を達成するために、長いWebページの観察を処理しなければならない。
既存のプルーニング戦略は、関連するコンテンツを捨てるか、無関係なコンテキストを保持するかのいずれかであり、最適以下の行動予測につながる。
FocusAgentは軽量LCMレトリバーを利用してアクセシビリティツリー(AxTree)観測から最も関連性の高い線を抽出するシンプルで効果的なアプローチである。
論文 参考訳(メタデータ) (2025-10-03T17:41:30Z) - VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - Large Multimodal Agents for Accurate Phishing Detection with Enhanced Token Optimization and Cost Reduction [2.8161155726745237]
本稿では,大規模なマルチモーダルエージェント,特に Gemini 1.5 Flash と GPT-4o mini を用いて,API によるURLと Web ページのスクリーンショットの解析を行う。
1つのエージェントがURLを評価し、2つめのエージェントがURLとスクリーンショットの両方を評価する。
コスト分析によれば、エージェントアプローチでは、GPT-4o miniはマルチモーダルアプローチの約4.2倍のWebサイトを100ドルあたり処理できる。
論文 参考訳(メタデータ) (2024-12-03T09:13:52Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z) - Position Paper: Think Globally, React Locally -- Bringing Real-time Reference-based Website Phishing Detection on macOS [0.4962561299282114]
最近のフィッシング攻撃の急増は、従来の反フィッシング・ブラックリストのアプローチの有効性を弱め続けている。
デバイス上でのフィッシング防止ソリューションは、ローカルで高速なフィッシング検出を提供するため、人気が高まっている。
コンピュータビジョンとデバイス上の機械学習モデルを組み合わせてウェブサイトをリアルタイムで分析するフィッシング検出ソリューションを提案する。
論文 参考訳(メタデータ) (2024-05-28T14:46:03Z) - A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0]
フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文 参考訳(メタデータ) (2024-03-13T14:26:25Z) - Reliability and Robustness analysis of Machine Learning based Phishing
URL Detectors [0.0]
MLPU(ML-based Phishing URL)検出器は、ユーザーや組織がフィッシング攻撃の犠牲者になることを防ぐための、最初の防御レベルとして機能する。
本稿では,50種類の最先端モデルの信頼性とロバスト性について検討する手法を提案する。
ボックスプロットとヒートマップを用いてその堅牢性と信頼性を解析した。
論文 参考訳(メタデータ) (2020-05-18T04:24:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。