論文の概要: PhishSSL: Self-Supervised Contrastive Learning for Phishing Website Detection
- arxiv url: http://arxiv.org/abs/2510.05900v1
- Date: Tue, 07 Oct 2025 13:07:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.262589
- Title: PhishSSL: Self-Supervised Contrastive Learning for Phishing Website Detection
- Title(参考訳): PhishSSL: フィッシングサイト検出のための自己監督型コントラスト学習
- Authors: Wenhao Li, Selvakumar Manickam, Yung-Wey Chong, Shankar Karuppayah, Priyadarsi Nanda, Binyong Li,
- Abstract要約: フィッシングサイトは、正当なサイトを模倣してユーザー情報を盗む。
既存の機械学習に基づく検出方法はラベル付きデータによる教師付き学習に依存している。
我々は、学習中にラベル付きフィッシングデータを必要としない自己教師付きコントラスト学習フレームワークであるPhishSSLを提案する。
- 参考スコア(独自算出の注目度): 7.006302905071325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phishing websites remain a persistent cybersecurity threat by mimicking legitimate sites to steal sensitive user information. Existing machine learning-based detection methods often rely on supervised learning with labeled data, which not only incurs substantial annotation costs but also limits adaptability to novel attack patterns. To address these challenges, we propose PhishSSL, a self-supervised contrastive learning framework that eliminates the need for labeled phishing data during training. PhishSSL combines hybrid tabular augmentation with adaptive feature attention to produce semantically consistent views and emphasize discriminative attributes. We evaluate PhishSSL on three phishing datasets with distinct feature compositions. Across all datasets, PhishSSL consistently outperforms unsupervised and self-supervised baselines, while ablation studies confirm the contribution of each component. Moreover, PhishSSL maintains robust performance despite the diversity of feature sets, highlighting its strong generalization and transferability. These results demonstrate that PhishSSL offers a promising solution for phishing website detection, particularly effective against evolving threats in dynamic Web environments.
- Abstract(参考訳): フィッシングサイトは、合法的なサイトを模倣して機密性の高いユーザー情報を盗むという、永続的なサイバーセキュリティの脅威のままだ。
既存の機械学習ベースの検出方法は、ラベル付きデータによる教師付き学習に頼っていることが多い。
これらの課題に対処するために、トレーニング中にラベル付きフィッシングデータを必要としない自己教師付きコントラスト学習フレームワークであるPhishSSLを提案する。
PhishSSLは、ハイブリッドな表層拡張と適応的な特徴注意を組み合わせることで、意味的に一貫したビューを生成し、差別的な属性を強調する。
特徴組成の異なる3つのフィッシングデータセット上でPhishSSLを評価する。
すべてのデータセットで、PhishSSLは教師なしと自己教師なしのベースラインを一貫して上回り、アブレーション研究は各コンポーネントのコントリビューションを確認している。
さらに、PhishSSLは機能セットの多様性にもかかわらず堅牢なパフォーマンスを維持しており、その強力な一般化と転送性を強調している。
これらの結果は、PhishSSLがWebサイトの検出をフィッシングするための有望なソリューションであり、特に動的Web環境における脅威の進化に対して有効であることを示している。
関連論文リスト
- Characterizing Phishing Pages by JavaScript Capabilities [77.64740286751834]
本論文は,フィッシングページのグループを自動的に識別し,研究者やアナリストを支援することを目的としている。
キット検出の精度は,4,562個のフィッシングURLに展開した548個のキット群に対して97%であった。
UIの対話性と基本的なフィンガープリントは、クラスタの90%と80%に存在する普遍的なテクニックであることが分かりました。
論文 参考訳(メタデータ) (2025-09-16T15:39:23Z) - From ML to LLM: Evaluating the Robustness of Phishing Webpage Detection Models against Adversarial Attacks [0.8050163120218178]
フィッシング攻撃は、ユーザーを騙して機密情報を盗み、重大なサイバーセキュリティの脅威を引き起こす。
我々は、さまざまなフィッシング機能を正当なWebページに埋め込むことで、敵対的なフィッシングWebページを生成するツールであるPhishOracleを開発した。
本研究は, フィッシング検出モデルによる敵攻撃に対する脆弱性を強調し, より堅牢な検出アプローチの必要性を強調した。
論文 参考訳(メタデータ) (2024-07-29T18:21:34Z) - The Performance of Sequential Deep Learning Models in Detecting Phishing Websites Using Contextual Features of URLs [0.0]
本研究では,マルチヘッド・アテンション,テンポラル・コンボリューショナル・ネットワーク(TCN),BI-LSTM,LSTMといった深層学習モデルを用いたフィッシングサイトの検出に焦点を当てた。
以上の結果から,マルチヘッド注意モデルとBI-LSTMモデルは,TCNやLSTMといった他の深層学習アルゴリズムよりも精度,リコール,F1スコアが優れていることが示された。
論文 参考訳(メタデータ) (2024-04-15T13:58:22Z) - Memorization in Self-Supervised Learning Improves Downstream Generalization [49.42010047574022]
自己教師付き学習(SSL)は、ラベルのないデータで純粋に高性能エンコーダを訓練する能力により、最近大きな注目を集めている。
SSL内での暗記を定義するためのフレームワークであるSSLMemを提案する。
論文 参考訳(メタデータ) (2024-01-19T11:32:47Z) - An Embarrassingly Simple Backdoor Attack on Self-supervised Learning [52.28670953101126]
自己教師付き学習(SSL)は、ラベルに頼ることなく、複雑なデータの高品質な表現を学習することができる。
SSLのバックドア攻撃に対する脆弱性について検討する。
論文 参考訳(メタデータ) (2022-10-13T20:39:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。