論文の概要: Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs
- arxiv url: http://arxiv.org/abs/2511.15434v1
- Date: Wed, 19 Nov 2025 13:45:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.825153
- Title: Small Language Models for Phishing Website Detection: Cost, Performance, and Privacy Trade-Offs
- Title(参考訳): フィッシングWebサイト検出のための小さな言語モデル:コスト、パフォーマンス、プライバシのトレードオフ
- Authors: Georg Goldenits, Philip Koenig, Sebastian Raubitzek, Andreas Ekelhart,
- Abstract要約: フィッシングサイトは大きなサイバーセキュリティの脅威となり、疑わしいユーザーを搾取し、財政的・組織的被害を引き起こす。
従来のフィッシング検出の機械学習アプローチでは、広範な機能エンジニアリング、継続的なリトレーニング、コストのかかるインフラストラクチャメンテナンスが必要になることが多い。
本稿では,HTML コードのみを用いて,フィッシングサイトを検出するための小型言語モデル (SLM) の実現可能性について検討する。
- 参考スコア(独自算出の注目度): 0.6299766708197881
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phishing websites pose a major cybersecurity threat, exploiting unsuspecting users and causing significant financial and organisational harm. Traditional machine learning approaches for phishing detection often require extensive feature engineering, continuous retraining, and costly infrastructure maintenance. At the same time, proprietary large language models (LLMs) have demonstrated strong performance in phishing-related classification tasks, but their operational costs and reliance on external providers limit their practical adoption in many business environments. This paper investigates the feasibility of small language models (SLMs) for detecting phishing websites using only their raw HTML code. A key advantage of these models is that they can be deployed on local infrastructure, providing organisations with greater control over data and operations. We systematically evaluate 15 commonly used Small Language Models (SLMs), ranging from 1 billion to 70 billion parameters, benchmarking their classification accuracy, computational requirements, and cost-efficiency. Our results highlight the trade-offs between detection performance and resource consumption, demonstrating that while SLMs underperform compared to state-of-the-art proprietary LLMs, they can still provide a viable and scalable alternative to external LLM services. By presenting a comparative analysis of costs and benefits, this work lays the foundation for future research on the adaptation, fine-tuning, and deployment of SLMs in phishing detection systems, aiming to balance security effectiveness and economic practicality.
- Abstract(参考訳): フィッシングサイトは大きなサイバーセキュリティの脅威となり、疑わしいユーザーを搾取し、財政的・組織的被害を引き起こす。
従来のフィッシング検出の機械学習アプローチでは、広範な機能エンジニアリング、継続的なリトレーニング、コストのかかるインフラストラクチャメンテナンスが必要になることが多い。
同時に、プロプライエタリな大規模言語モデル(LLM)は、フィッシング関連の分類タスクにおいて高いパフォーマンスを示してきたが、その運用コストと外部プロバイダへの依存は、多くのビジネス環境での実践的採用を制限する。
本稿では,HTML コードのみを用いて,フィッシングサイトを検出するための小型言語モデル (SLM) の実現可能性について検討する。
これらのモデルの主な利点は、ローカルインフラストラクチャにデプロイ可能であり、組織がデータやオペレーションをよりコントロールできることです。
我々は15の一般的なスモール言語モデル(SLM)を体系的に評価し、その分類精度、計算要求、費用効率をベンチマークした。
以上の結果から,SLM は最先端の独自 LLM に比べて性能が劣る一方で,外部 LLM サービスに代わる実用的でスケーラブルな代替手段を提供することが可能であることを実証した。
本研究は、コストと利益の比較分析により、フィッシング検知システムにおけるSLMの適応、微調整、展開に関する将来の研究の基盤を築き、セキュリティの有効性と経済的実践性のバランスを図った。
関連論文リスト
- Towards Trustworthy Lexical Simplification: Exploring Safety and Efficiency with Small LLMs [3.0708839100887833]
大規模言語モデル(LLM)は、語彙的単純化の現実的な応用において課題に直面している。
脆弱なユーザグループ(例えば障害のある人々)は、この技術の主要なターゲットグループのひとつです。
ローカル環境に展開可能な小型LCMを利用するLSシステムのための効率的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-29T17:25:56Z) - Phishing Detection in the Gen-AI Era: Quantized LLMs vs Classical Models [1.4999444543328293]
フィッシング攻撃はますます洗練され、高精度と計算効率のバランスをとる検知システムの必要性が強調されている。
本稿では、フィッシング検出のための従来の機械学習(ML)、ディープラーニング(DL)、および量子化された小パラメータ大規模言語モデル(LLM)の比較評価を行う。
現在,LLMはML法やDL法に比べて精度が低いが,文脈に基づく微妙なフィッシング手法を識別する可能性が強い。
論文 参考訳(メタデータ) (2025-07-10T04:01:52Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文 参考訳(メタデータ) (2025-03-20T19:52:30Z) - Deep Learning Approaches for Anti-Money Laundering on Mobile Transactions: Review, Framework, and Directions [51.43521977132062]
マネーロンダリング(英: Money laundering)は、不正資金の起源を隠蔽する金融犯罪である。
モバイル決済プラットフォームとスマートIoTデバイスの普及は、マネーロンダリング対策をかなり複雑にしている。
本稿では,AMLにおけるディープラーニングソリューションとその利用に関する課題について,包括的レビューを行う。
論文 参考訳(メタデータ) (2025-03-13T05:19:44Z) - Can LLMs Hack Enterprise Networks? Autonomous Assumed Breach Penetration-Testing Active Directory Networks [1.3124479769761592]
本稿では,Large Language Model (LLM) 駆動自律システムを用いた新しいプロトタイプを提案する。
我々のシステムは、完全に自律的でLLM駆動のフレームワークがアカウントを妥協できる最初の実演である。
関連するコストは、プロフェッショナルな人間のペンテスト担当者によって引き起こされるコストと競合し、しばしばかなり低いことが分かりました。
論文 参考訳(メタデータ) (2025-02-06T17:12:43Z) - Adversarial Reasoning at Jailbreaking Time [49.70772424278124]
大規模言語モデル(LLM)は、より有能で広く普及している。
テスト時間計算の標準化, 測定, スケーリングの最近の進歩は, ハードタスクにおける高い性能を達成するためにモデルを最適化するための新しい手法を提案する。
本稿では、これらの進歩をジェイルブレイクモデルに応用し、協調LDMから有害な応答を誘発する。
論文 参考訳(メタデータ) (2025-02-03T18:59:01Z) - CEBench: A Benchmarking Toolkit for the Cost-Effectiveness of LLM Pipelines [23.925385446070717]
CEBenchは、オンラインの大規模言語モデルをベンチマークするためのオープンソースのツールキットである。
LLMデプロイメントに必要な支出と有効性の間の重要なトレードオフに焦点を当てている。
この能力は、コストへの影響を最小限にしつつ、有効性を最大化することを目的とした重要な意思決定プロセスをサポートします。
論文 参考訳(メタデータ) (2024-06-20T21:36:00Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。