論文の概要: Multimodal Large Language Models for Phishing Webpage Detection and Identification
- arxiv url: http://arxiv.org/abs/2408.05941v1
- Date: Mon, 12 Aug 2024 06:36:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 13:35:58.359708
- Title: Multimodal Large Language Models for Phishing Webpage Detection and Identification
- Title(参考訳): フィッシングWebページの検出と識別のためのマルチモーダル大言語モデル
- Authors: Jehyun Lee, Peiyuan Lim, Bryan Hooi, Dinil Mon Divakaran,
- Abstract要約: フィッシングWebページの検出における大規模言語モデル(LLM)の有効性について検討した。
我々のシステムは高精度で高い検出率を達成する。
また、決定の解釈可能な証拠も提供する。
- 参考スコア(独自算出の注目度): 29.291474807301594
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: To address the challenging problem of detecting phishing webpages, researchers have developed numerous solutions, in particular those based on machine learning (ML) algorithms. Among these, brand-based phishing detection that uses models from Computer Vision to detect if a given webpage is imitating a well-known brand has received widespread attention. However, such models are costly and difficult to maintain, as they need to be retrained with labeled dataset that has to be regularly and continuously collected. Besides, they also need to maintain a good reference list of well-known websites and related meta-data for effective performance. In this work, we take steps to study the efficacy of large language models (LLMs), in particular the multimodal LLMs, in detecting phishing webpages. Given that the LLMs are pretrained on a large corpus of data, we aim to make use of their understanding of different aspects of a webpage (logo, theme, favicon, etc.) to identify the brand of a given webpage and compare the identified brand with the domain name in the URL to detect a phishing attack. We propose a two-phase system employing LLMs in both phases: the first phase focuses on brand identification, while the second verifies the domain. We carry out comprehensive evaluations on a newly collected dataset. Our experiments show that the LLM-based system achieves a high detection rate at high precision; importantly, it also provides interpretable evidence for the decisions. Our system also performs significantly better than a state-of-the-art brand-based phishing detection system while demonstrating robustness against two known adversarial attacks.
- Abstract(参考訳): フィッシングWebページの検出という課題に対処するため、研究者は機械学習(ML)アルゴリズムに基づく多くのソリューションを開発した。
中でも、あるWebページが有名ブランドを模倣しているかどうかを検出するために、Computer Visionのモデルを使用するブランドベースのフィッシング検出は、広く注目を集めている。
しかしながら、このようなモデルは、定期的に継続的に収集される必要があるラベル付きデータセットで再トレーニングされる必要があるため、コストが高く、メンテナンスが難しい。
さらに、優れたパフォーマンスを得るためには、よく知られたWebサイトと関連するメタデータの参照リストを維持する必要がある。
本研究では,大規模言語モデル(LLM),特にマルチモーダル LLM のフィッシングWebページの検出における有効性について検討する。
LLMは大規模なデータコーパスで事前訓練されているので、Webページの異なる側面(ログ、テーマ、ファビコンなど)の理解を活用して、指定されたWebページのブランドを特定し、識別されたブランドとURLのドメイン名を比較してフィッシング攻撃を検出する。
両フェーズにLLMを用いた2相システムを提案する。第1フェーズはブランド識別に焦点を当て,第2フェーズはドメインを検証する。
新たに収集したデータセットに対して総合的な評価を行う。
実験の結果,LLMに基づくシステムは高い精度で高い検出率を達成できることが判明した。
また,既存のブランドベースのフィッシング検出システムよりも,2つの敵攻撃に対する堅牢性を実証し,性能を著しく向上させた。
関連論文リスト
- PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.106113544525545]
フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な限界に遭遇している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文 参考訳(メタデータ) (2024-08-20T11:14:21Z) - AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models [95.09157454599605]
大規模言語モデル(LLM)はますます強力になってきていますが、それでも顕著ですが微妙な弱点があります。
従来のベンチマークアプローチでは、特定のモデルの欠陥を徹底的に特定することはできない。
さまざまなタスクにまたがるLLMの弱点を自動的に露呈する統合フレームワークであるAutoDetectを導入する。
論文 参考訳(メタデータ) (2024-06-24T15:16:45Z) - Position Paper: Think Globally, React Locally -- Bringing Real-time Reference-based Website Phishing Detection on macOS [0.4962561299282114]
最近のフィッシング攻撃の急増は、従来の反フィッシング・ブラックリストのアプローチの有効性を弱め続けている。
デバイス上でのフィッシング防止ソリューションは、ローカルで高速なフィッシング検出を提供するため、人気が高まっている。
コンピュータビジョンとデバイス上の機械学習モデルを組み合わせてウェブサイトをリアルタイムで分析するフィッシング検出ソリューションを提案する。
論文 参考訳(メタデータ) (2024-05-28T14:46:03Z) - A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0]
フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文 参考訳(メタデータ) (2024-03-13T14:26:25Z) - KnowPhish: Large Language Models Meet Multimodal Knowledge Graphs for Enhancing Reference-Based Phishing Detection [36.014171641453615]
各ブランドに関する情報が豊富な20万のブランドを含む,自動知識収集パイプラインを提案する。
KnowPhishは、既存の参照ベースのフィッシング検出器の性能を高めるために使用できる。
結果として得られたマルチモーダルフィッシング検出手法であるKnowPhish Detectorは,ロゴの有無にかかわらずフィッシングWebページを検出することができる。
論文 参考訳(メタデータ) (2024-03-04T17:38:32Z) - SHIELD : An Evaluation Benchmark for Face Spoofing and Forgery Detection
with Multimodal Large Language Models [63.946809247201905]
フェーススプーフィングと偽造検出におけるMLLMの能力を評価するための新しいベンチマーク、ShielDを導入する。
我々は、これらの2つの顔セキュリティタスクにおいて、マルチモーダル顔データを評価するために、真/偽/複数選択の質問を設計する。
その結果,MLLMは顔セキュリティ領域において大きな可能性を秘めていることがわかった。
論文 参考訳(メタデータ) (2024-02-06T17:31:36Z) - Detecting Phishing Sites Using ChatGPT [2.3999111269325266]
本稿では,大規模言語モデル(LLM)を用いてフィッシングサイトを検出するChatPhishDetectorという新しいシステムを提案する。
本システムでは,Webクローラを利用してWebサイトから情報を収集し,クローリングデータに基づいてLLMのプロンプトを生成し,LLMが生成した応答から検出結果を取得する。
GPT-4Vを用いた実験結果は、98.7%の精度と99.6%のリコールで優れた性能を示し、他のLLMや既存のシステムよりも優れていた。
論文 参考訳(メタデータ) (2023-06-09T11:30:08Z) - Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection
Capability [70.72426887518517]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイする際に、セキュアAIの必須の側面である。
本稿では,IDデータを用いた学習モデルのOOD識別能力を復元する新しい手法であるUnleashing Maskを提案する。
本手法では, マスクを用いて記憶した非定型サンプルを抽出し, モデルを微調整するか, 導入したマスクでプルーする。
論文 参考訳(メタデータ) (2023-06-06T14:23:34Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - An Effective and Robust Detector for Logo Detection [58.448716977297565]
一部の攻撃者は、よく訓練されたロゴ検出モデルを侵害で騙している。
本稿では,2回検討する機構に基づく新しいロゴ検出手法を提案する。
我々は,デテクトRSアルゴリズムを,等化損失関数,マルチスケール変換,および逆データ拡張を備えたカスケードスキーマに拡張する。
論文 参考訳(メタデータ) (2021-08-01T10:17:53Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。