論文の概要: PhishKey: A Novel Centroid-Based Approach for Enhanced Phishing Detection Using Adaptive HTML Component Extraction
- arxiv url: http://arxiv.org/abs/2506.21106v1
- Date: Thu, 26 Jun 2025 09:04:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.032609
- Title: PhishKey: A Novel Centroid-Based Approach for Enhanced Phishing Detection Using Adaptive HTML Component Extraction
- Title(参考訳): PhishKey: 適応HTML成分抽出を用いた改良フィッシング検出のためのCentroidベースの新しいアプローチ
- Authors: Felipe Castaño, Eduardo Fidalgo, Enrique Alegre, Rocio Alaiz-Rodríguez, Raul Orduna, Francesco Zola,
- Abstract要約: PhishKeyはハイブリッドソースからの自動特徴抽出を用いた新しいフィッシング検出手法である。
文字レベルの処理とURL分類のためのCNN、ワードレベルのHTMLコンテンツのためのCentroidベースのKey Component Phishing Extractor(CAPE)を組み合わせる。
最大98.70%のF1スコアを実現し、性能劣化を最小限に抑えたインジェクションアタックのような敵の操作に対して強い抵抗を示す。
- 参考スコア(独自算出の注目度): 6.514730930658212
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Phishing attacks pose a significant cybersecurity threat, evolving rapidly to bypass detection mechanisms and exploit human vulnerabilities. This paper introduces PhishKey to address the challenges of adaptability, robustness, and efficiency. PhishKey is a novel phishing detection method using automatic feature extraction from hybrid sources. PhishKey combines character-level processing with Convolutional Neural Networks (CNN) for URL classification, and a Centroid-Based Key Component Phishing Extractor (CAPE) for HTML content at the word level. CAPE reduces noise and ensures complete sample processing avoiding crop operations on the input data. The predictions from both modules are integrated using a soft-voting ensemble to achieve more accurate and reliable classifications. Experimental evaluations on four state-of-the-art datasets demonstrate the effectiveness of PhishKey. It achieves up to 98.70% F1 Score and shows strong resistance to adversarial manipulations such as injection attacks with minimal performance degradation.
- Abstract(参考訳): フィッシング攻撃は重大なサイバーセキュリティの脅威となり、検出メカニズムをバイパスし、人間の脆弱性を悪用するために急速に進化する。
本稿では、適応性、堅牢性、効率性の課題に対処するため、PhishKeyを紹介する。
PhishKeyはハイブリッドソースからの自動特徴抽出を用いた新しいフィッシング検出手法である。
PhishKeyは、文字レベルの処理とURL分類のための畳み込みニューラルネットワーク(CNN)と、単語レベルのHTMLコンテンツのためのCentroidベースのキーコンポーネントフィッシングエクストラクタ(CAPE)を組み合わせる。
CAPEはノイズを低減し、入力データに対する作物の操作を避けるための完全なサンプル処理を保証する。
両方のモジュールからの予測は、より正確で信頼性の高い分類を実現するために、ソフト投票アンサンブルを用いて統合される。
4つの最先端データセットの実験的評価は、PhishKeyの有効性を示す。
最大98.70%のF1スコアを実現し、性能劣化を最小限に抑えたインジェクションアタックのような敵の操作に対して強い抵抗を示す。
関連論文リスト
- Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning [44.99833362998488]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で機械学習モデルのトレーニングを可能にする。
異常なクライアントや破損したクライアントの存在は、モデルパフォーマンスを著しく低下させる可能性がある。
我々は、トレーニング前に悪意のあるクライアントにラベル付けする検出アルゴリズムWAFFLEを提案する。
蒸留された公開データセットに基づいてトレーニングされた軽量検出器は、最小限の通信と計算オーバーヘッドでラベル付けを実行する。
論文 参考訳(メタデータ) (2025-06-11T12:48:00Z) - PhishVQC: Optimizing Phishing URL Detection with Correlation Based Feature Selection and Variational Quantum Classifier [0.0]
本稿では、量子コンピューティングによって動機づけられた変分量子(VQC)を用いて、フィッシングURLの検出を改善することを提案する。
本稿では、量子マップとRealAmplitudeやEfficientSU2といった変分アンサーゼを組み合わせた量子モデルPhishVQCを提案する。
これは、フィッシング検出精度を改善するための量子機械学習の可能性を強調している。
論文 参考訳(メタデータ) (2025-03-03T18:28:01Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0]
フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文 参考訳(メタデータ) (2024-03-13T14:26:25Z) - AntiPhishStack: LSTM-based Stacked Generalization Model for Optimized
Phishing URL Detection [0.32141666878560626]
本稿では,フィッシングサイトを検出するための2相スタック一般化モデルであるAntiPhishStackを提案する。
このモデルは、URLと文字レベルのTF-IDF特徴の学習を対称的に活用し、新たなフィッシング脅威に対処する能力を高める。
良性およびフィッシングまたは悪意のあるURLを含む2つのベンチマークデータセットに対する実験的検証は、既存の研究と比較して96.04%の精度で、このモデルの例外的な性能を示している。
論文 参考訳(メタデータ) (2024-01-17T03:44:27Z) - IMBERT: Making BERT Immune to Insertion-based Backdoor Attacks [45.81957796169348]
バックドア攻撃は、機械学習モデルに対する汚いセキュリティ脅威だ。
IMBERTは、被害者モデルから得られた勾配または自己注意スコアを用いて、バックドア攻撃に対する自己防衛を行う。
我々の実証研究は、IMBERTが挿入されたトリガーの98.5%を効果的に識別できることを示した。
論文 参考訳(メタデータ) (2023-05-25T22:08:57Z) - PhishSim: Aiding Phishing Website Detection with a Feature-Free Tool [12.468922937529966]
正規化圧縮距離(NCD)を用いたフィッシングサイト検出のための機能フリー手法を提案する。
この尺度は2つのウェブサイトの類似性を圧縮することで計算し、特徴抽出を行う必要がなくなる。
我々はFurthest Point Firstアルゴリズムを用いてフィッシングプロトタイプ抽出を行い、フィッシングWebページのクラスタを表すインスタンスを選択する。
論文 参考訳(メタデータ) (2022-07-13T20:44:03Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - How Robust are Randomized Smoothing based Defenses to Data Poisoning? [66.80663779176979]
我々は、トレーニングデータの品質の重要性を強調する堅牢な機械学習モデルに対して、これまで認識されていなかった脅威を提示します。
本稿では,二段階最適化に基づく新たなデータ中毒攻撃法を提案し,ロバストな分類器のロバスト性を保証する。
我々の攻撃は、被害者が最先端のロバストな訓練方法を用いて、ゼロからモデルを訓練しても効果的である。
論文 参考訳(メタデータ) (2020-12-02T15:30:21Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。