論文の概要: PhishIntentionLLM: Uncovering Phishing Website Intentions through Multi-Agent Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2507.15419v1
- Date: Mon, 21 Jul 2025 09:20:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.337948
- Title: PhishIntentionLLM: Uncovering Phishing Website Intentions through Multi-Agent Retrieval-Augmented Generation
- Title(参考訳): PhishIntentionLLM:マルチエージェント検索によるフィッシングサイトインテンションの発見
- Authors: Wenhao Li, Selvakumar Manickam, Yung-wey Chong, Shankar Karuppayah,
- Abstract要約: ウェブサイトのスクリーンショットからフィッシングの意図を明らかにするフレームワークであるPhishIntentionLLMを提案する。
本フレームワークは, クレジットカード盗難, 金融詐欺, マルウェア配布, 個人情報盗難の4つの主要なフィッシング対象を識別する。
セクター間で大規模なフィッシング意図プロファイリングを行うために,9Kサンプルの大きなデータセットを生成する。
- 参考スコア(独自算出の注目度): 13.177607247367211
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phishing websites remain a major cybersecurity threat, yet existing methods primarily focus on detection, while the recognition of underlying malicious intentions remains largely unexplored. To address this gap, we propose PhishIntentionLLM, a multi-agent retrieval-augmented generation (RAG) framework that uncovers phishing intentions from website screenshots. Leveraging the visual-language capabilities of large language models (LLMs), our framework identifies four key phishing objectives: Credential Theft, Financial Fraud, Malware Distribution, and Personal Information Harvesting. We construct and release the first phishing intention ground truth dataset (~2K samples) and evaluate the framework using four commercial LLMs. Experimental results show that PhishIntentionLLM achieves a micro-precision of 0.7895 with GPT-4o and significantly outperforms the single-agent baseline with a ~95% improvement in micro-precision. Compared to the previous work, it achieves 0.8545 precision for credential theft, marking a ~4% improvement. Additionally, we generate a larger dataset of ~9K samples for large-scale phishing intention profiling across sectors. This work provides a scalable and interpretable solution for intention-aware phishing analysis.
- Abstract(参考訳): フィッシングサイトは依然としてサイバーセキュリティの脅威だが、既存の手法は主に検出に焦点を当てている。
このギャップに対処するために、ウェブサイトのスクリーンショットからフィッシングの意図を明らかにするマルチエージェント検索拡張生成(RAG)フレームワークであるPhishIntentionLLMを提案する。
我々のフレームワークは,大規模言語モデル(LLM)の視覚言語機能を活用することで,Credential Theft,Financial Fraud,Malware Distribution,Personal Information Harvestingの4つの重要なフィッシング目標を特定した。
我々は,最初のフィッシング意図基底真理データセット(約2Kサンプル)を構築し,そのフレームワークを4つの商用LCMを用いて評価した。
実験の結果,PhishIntentionLLMはGPT-4oで0.7895マイクロ精度を実現し,マイクロ精度が約95%向上した。
以前の研究と比較すると、クレデンシャル盗難の精度は0.8545で、約4%改善している。
さらに、セクター間で大規模なフィッシング意図プロファイリングを行うために、より大規模な9Kサンプルのデータセットを生成する。
この研究は、意図を認識したフィッシング分析のためのスケーラブルで解釈可能なソリューションを提供する。
関連論文リスト
- CyberGym: Evaluating AI Agents' Cybersecurity Capabilities with Real-World Vulnerabilities at Scale [46.76144797837242]
大規模言語モデル(LLM)エージェントは、自律的なサイバーセキュリティタスクの処理において、ますます熟練している。
既存のベンチマークは不足していて、現実のシナリオをキャプチャできなかったり、スコープが限られていたりします。
我々はCyberGymを紹介した。CyberGymは1,507の現実世界の脆弱性を特徴とする大規模かつ高品質なサイバーセキュリティ評価フレームワークである。
論文 参考訳(メタデータ) (2025-06-03T07:35:14Z) - Phishing URL Detection using Bi-LSTM [0.0]
本稿では,URLを4つのカテゴリに分類する深層学習に基づくアプローチを提案する。
650,000以上のURLからなるデータセットの実験結果は、モデルの有効性を示し、97%の精度と従来の技術よりも大幅に改善された。
論文 参考訳(メタデータ) (2025-04-29T00:55:01Z) - EXPLICATE: Enhancing Phishing Detection through Explainable AI and LLM-Powered Interpretability [44.2907457629342]
EXPLICATEは、三成分アーキテクチャによるフィッシング検出を強化するフレームワークである。
既存のディープラーニング技術と同等ですが、説明性が向上しています。
自動AIとフィッシング検出システムにおけるユーザ信頼の重大な隔たりに対処する。
論文 参考訳(メタデータ) (2025-03-22T23:37:35Z) - Benchmarking Reasoning Robustness in Large Language Models [76.79744000300363]
新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-03-06T15:36:06Z) - PEEK: Phishing Evolution Framework for Phishing Generation and Evolving Pattern Analysis using Large Language Models [10.455333111937598]
フィッシングはいまだに広範囲にわたるサイバー脅威であり、攻撃者は詐欺メールを使って被害者を誘惑し、機密情報を暴露している。
深層学習はフィッシング攻撃に対する防御において重要な要素となっているが、これらのアプローチは重大な制限に直面している。
フィッシングメールデータセットの質と多様性を向上するためのPEEK(Phishing Evolution FramEworK)を提案する。
論文 参考訳(メタデータ) (2024-11-18T09:03:51Z) - PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.106113544525545]
フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な制限に直面している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文 参考訳(メタデータ) (2024-08-20T11:14:21Z) - Automated Phishing Detection Using URLs and Webpages [35.66275851732625]
LLMエージェントフレームワークの開発により,従来の参照型フィッシング検出の制約に対処する。
このエージェントは、Large Language Modelsを利用して、積極的にオンライン情報を取得し、活用する。
我々の手法は0.945の精度で達成され、既存の解(DynaPhish)を0.445で大幅に上回っている。
論文 参考訳(メタデータ) (2024-08-03T05:08:27Z) - From ML to LLM: Evaluating the Robustness of Phishing Webpage Detection Models against Adversarial Attacks [0.8050163120218178]
フィッシング攻撃は、ユーザーを騙して機密情報を盗み、重大なサイバーセキュリティの脅威を引き起こす。
我々は、さまざまなフィッシング機能を正当なWebページに埋め込むことで、敵対的なフィッシングWebページを生成するツールであるPhishOracleを開発した。
本研究は, フィッシング検出モデルによる敵攻撃に対する脆弱性を強調し, より堅牢な検出アプローチの必要性を強調した。
論文 参考訳(メタデータ) (2024-07-29T18:21:34Z) - G$^2$uardFL: Safeguarding Federated Learning Against Backdoor Attacks
through Attributed Client Graph Clustering [116.4277292854053]
Federated Learning (FL)は、データ共有なしで協調的なモデルトレーニングを提供する。
FLはバックドア攻撃に弱いため、有害なモデル重みがシステムの整合性を損なう。
本稿では、悪意のあるクライアントの識別を属性グラフクラスタリング問題として再解釈する保護フレームワークであるG$2$uardFLを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:15:04Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Towards Web Phishing Detection Limitations and Mitigation [21.738240693843295]
フィッシングサイトが機械学習に基づく検出をバイパスする方法を示す。
100Kフィッシング・ベナンサイトを用いた実験では、有望な精度(98.8%)を示した。
本稿では,ロジスティック回帰に基づくよりレジリエントなモデルであるAnti-SubtlePhishを提案する。
論文 参考訳(メタデータ) (2022-04-03T04:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。