論文の概要: Large Multimodal Agents for Accurate Phishing Detection with Enhanced Token Optimization and Cost Reduction
- arxiv url: http://arxiv.org/abs/2412.02301v1
- Date: Tue, 03 Dec 2024 09:13:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:50:58.712599
- Title: Large Multimodal Agents for Accurate Phishing Detection with Enhanced Token Optimization and Cost Reduction
- Title(参考訳): トークン最適化とコスト削減による高精度フィッシング検出のための大規模マルチモーダルエージェント
- Authors: Fouad Trad, Ali Chehab,
- Abstract要約: 本稿では,大規模なマルチモーダルエージェント,特に Gemini 1.5 Flash と GPT-4o mini を用いて,API によるURLと Web ページのスクリーンショットの解析を行う。
1つのエージェントがURLを評価し、2つめのエージェントがURLとスクリーンショットの両方を評価する。
コスト分析によれば、エージェントアプローチでは、GPT-4o miniはマルチモーダルアプローチの約4.2倍のWebサイトを100ドルあたり処理できる。
- 参考スコア(独自算出の注目度): 2.8161155726745237
- License:
- Abstract: With the rise of sophisticated phishing attacks, there is a growing need for effective and economical detection solutions. This paper explores the use of large multimodal agents, specifically Gemini 1.5 Flash and GPT-4o mini, to analyze both URLs and webpage screenshots via APIs, thus avoiding the complexities of training and maintaining AI systems. Our findings indicate that integrating these two data types substantially enhances detection performance over using either type alone. However, API usage incurs costs per query that depend on the number of input and output tokens. To address this, we propose a two-tiered agentic approach: initially, one agent assesses the URL, and if inconclusive, a second agent evaluates both the URL and the screenshot. This method not only maintains robust detection performance but also significantly reduces API costs by minimizing unnecessary multi-input queries. Cost analysis shows that with the agentic approach, GPT-4o mini can process about 4.2 times as many websites per $100 compared to the multimodal approach (107,440 vs. 25,626), and Gemini 1.5 Flash can process about 2.6 times more websites (2,232,142 vs. 862,068). These findings underscore the significant economic benefits of the agentic approach over the multimodal method, providing a viable solution for organizations aiming to leverage advanced AI for phishing detection while controlling expenses.
- Abstract(参考訳): フィッシング攻撃の高度化に伴い、効果的かつ経済的検出ソリューションの必要性が高まっている。
本稿では、大規模なマルチモーダルエージェント、特にGemini 1.5 FlashとGPT-4o miniを使用して、APIを介してURLとWebページのスクリーンショットを分析することにより、AIシステムのトレーニングとメンテナンスの複雑さを回避する。
以上の結果から,これらの2つのデータ型を統合することで,いずれの使用よりも検出性能が著しく向上することが示唆された。
しかし、APIの使用は、入力トークンと出力トークンの数に依存するクエリ毎にコストを発生させる。
この問題に対処するために,まず1つのエージェントがURLを評価し,もう1つのエージェントがURLとスクリーンショットの両方を評価するという2段階のエージェントアプローチを提案する。
この方法は、堅牢な検出性能を維持するだけでなく、不要なマルチインプットクエリを最小限にすることで、APIコストを大幅に削減する。
コスト分析により、GPT-4o miniはマルチモーダルアプローチ(107,440対25,626)に比べて100ドル当たり4.2倍のWebサイトを処理でき、Gemini 1.5 Flashは2.6倍のWebサイトを処理できる(2,232,142対862,068)。
これらの知見は、マルチモーダル手法に対するエージェント的アプローチの経済的メリットを顕著に示しており、費用を抑えながらフィッシング検出に先進的なAIを活用することを目指す組織に対して、実行可能なソリューションを提供する。
関連論文リスト
- Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems [42.137278756052595]
$texttAgentPrune$は、メインストリームのマルチエージェントシステムにシームレスに統合できる。
textbf(I)は、既存のマルチエージェントフレームワークとシームレスに統合され、28.1%sim72.8%downarrow$トークンの削減を行う。
textbf(III)は2種類のエージェントベースの敵攻撃に対して3.5%sim10.8%uparrow$パフォーマンス向上で防御に成功した。
論文 参考訳(メタデータ) (2024-10-03T14:14:31Z) - On the Resilience of Multi-Agent Systems with Malicious Agents [58.79302663733702]
本稿では,悪意のあるエージェント下でのマルチエージェントシステムのレジリエンスについて検討する。
我々は、任意のエージェントを悪意のあるエージェントに変換する2つの方法、AutoTransformとAutoInjectを考案した。
各エージェントが他のエージェントの出力に挑戦するためのメカニズムを導入するか、あるいはメッセージのレビューと修正を行う追加のエージェントを導入することで、システムのレジリエンスを高めることができることを示す。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - PhishGuard: A Convolutional Neural Network Based Model for Detecting Phishing URLs with Explainability Analysis [1.102674168371806]
フィッシングURLの識別は、この問題に対処する最善の方法だ。
フィッシングURLの検出を自動化するために,機械学習と深層学習の手法が提案されている。
本稿では,1次元畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2024-04-27T17:13:49Z) - Securing Transactions: A Hybrid Dependable Ensemble Machine Learning
Model using IHT-LR and Grid Search [2.4374097382908477]
本稿では,複数のアルゴリズムをインテリジェントに組み合わせて不正識別を強化する,最先端のハイブリッドアンサンブル(ENS)機械学習(ML)モデルを提案する。
実験は,284,807件の取引からなる公開クレジットカードデータセットを用いて実施した。
提案したモデルは、99.66%、99.73%、98.56%、99.79%の精度で、それぞれDT、RF、KNN、ENSモデルに完全100%の精度を実現している。
論文 参考訳(メタデータ) (2024-02-22T09:01:42Z) - Efficient Verification-Based Face Identification [50.616875565173274]
効率の良いニューラルモデルで顔認証を行う際の問題点を$f$で検討する。
我々のモデルは、23kパラメータと5M浮動小数点演算(FLOPS)しか必要としない、かなり小さな$f$に導かれる。
我々は、6つの顔認証データセットを用いて、我々の手法が最先端のモデルよりも同等か優れていることを示す。
論文 参考訳(メタデータ) (2023-12-20T18:08:02Z) - Adversarially Robust Deep Learning with Optimal-Transport-Regularized
Divergences [12.1942837946862]
我々は、ディープラーニングモデルの対角的堅牢性を高めるための新しいアプローチとして、$ARMOR_D$メソッドを紹介した。
マルウェア検出と画像認識における本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-09-07T15:41:45Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Generative Adversarial Network-Driven Detection of Adversarial Tasks in
Mobile Crowdsensing [5.675436513661266]
クラウドセンシングシステムは、不特定かつユビキタスなプロパティの上に構築されるため、さまざまな攻撃に対して脆弱である。
以前の研究では、GANベースの攻撃は実験的に設計された攻撃サンプルよりも重大な破壊力を示すことが示唆されている。
本稿では,GANモデルを統合することにより,知的に設計された不正なセンシングサービス要求を検出することを目的とする。
論文 参考訳(メタデータ) (2022-02-16T00:23:25Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。