論文の概要: PhishSim: Aiding Phishing Website Detection with a Feature-Free Tool
- arxiv url: http://arxiv.org/abs/2207.10801v1
- Date: Wed, 13 Jul 2022 20:44:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-31 14:27:42.107894
- Title: PhishSim: Aiding Phishing Website Detection with a Feature-Free Tool
- Title(参考訳): phishsim: フィッシングのwebサイト検出を支援する機能フリーツール
- Authors: Rizka Purwanto, Arindam Pal, Alan Blair, Sanjay Jha
- Abstract要約: 正規化圧縮距離(NCD)を用いたフィッシングサイト検出のための機能フリー手法を提案する。
この尺度は2つのウェブサイトの類似性を圧縮することで計算し、特徴抽出を行う必要がなくなる。
我々はFurthest Point Firstアルゴリズムを用いてフィッシングプロトタイプ抽出を行い、フィッシングWebページのクラスタを表すインスタンスを選択する。
- 参考スコア(独自算出の注目度): 12.468922937529966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a feature-free method for detecting phishing
websites using the Normalized Compression Distance (NCD), a parameter-free
similarity measure which computes the similarity of two websites by compressing
them, thus eliminating the need to perform any feature extraction. It also
removes any dependence on a specific set of website features. This method
examines the HTML of webpages and computes their similarity with known phishing
websites, in order to classify them. We use the Furthest Point First algorithm
to perform phishing prototype extractions, in order to select instances that
are representative of a cluster of phishing webpages. We also introduce the use
of an incremental learning algorithm as a framework for continuous and adaptive
detection without extracting new features when concept drift occurs. On a large
dataset, our proposed method significantly outperforms previous methods in
detecting phishing websites, with an AUC score of 98.68%, a high true positive
rate (TPR) of around 90%, while maintaining a low false positive rate (FPR) of
0.58%. Our approach uses prototypes, eliminating the need to retain long term
data in the future, and is feasible to deploy in real systems with a processing
time of roughly 0.3 seconds.
- Abstract(参考訳): 本稿では,2つのWebサイトを圧縮して類似度を計算するパラメータフリー類似度尺度である正規化圧縮距離(NCD)を用いて,フィッシングサイトを検出する機能フリー手法を提案する。
また、特定のwebサイト機能への依存をなくすこともできる。
本手法は,WebページのHTMLを検証し,既知のフィッシングサイトと類似性を計算して分類する。
フィッシングwebページのクラスタを代表するインスタンスを選択するために,第1のポイントファーストアルゴリズムを用いてフィッシングプロトタイプの抽出を行う。
また,概念ドリフト発生時の新機能を抽出せずに,連続的かつ適応的な検出のためのフレームワークとしてインクリメンタル学習アルゴリズムを導入する。
大規模データセットにおいて,提案手法は,aucスコア98.68%,tpr (high true positive rate) 約90%,fpr (low false positive rate) 0.58%において,フィッシングwebサイト検出における従来の手法を大幅に上回っている。
提案手法ではプロトタイプを用いて,将来的な長期データ保持の必要性を排除し,約0.3秒の処理時間で実システムにデプロイすることが可能である。
関連論文リスト
- TempNet: Temporal Attention Towards the Detection of Animal Behaviour in
Videos [63.85815474157357]
本稿では,映像中の生物学的行動を検出するための,効率的なコンピュータビジョンと深層学習に基づく手法を提案する。
TempNetはエンコーダブリッジと残留ブロックを使用して、2段階の空間的、そして時間的、エンコーダでモデル性能を維持する。
本研究では,サブルフィッシュ (Anoplopoma fimbria) 幼虫の検出への応用を実証する。
論文 参考訳(メタデータ) (2022-11-17T23:55:12Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - Towards Web Phishing Detection Limitations and Mitigation [21.738240693843295]
フィッシングサイトが機械学習に基づく検出をバイパスする方法を示す。
100Kフィッシング・ベナンサイトを用いた実験では、有望な精度(98.8%)を示した。
本稿では,ロジスティック回帰に基づくよりレジリエントなモデルであるAnti-SubtlePhishを提案する。
論文 参考訳(メタデータ) (2022-04-03T04:26:04Z) - Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - PhishMatch: A Layered Approach for Effective Detection of Phishing URLs [8.658596218544774]
We present a layered anti-phishing defense, PhishMatch, which is robust, accurate, expensive, and client-side。
Chromeブラウザ用に開発されたPhishMatchのプロトタイププラグインは、高速で軽量であることが判明した。
論文 参考訳(メタデータ) (2021-12-04T03:21:29Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - PhishZip: A New Compression-based Algorithm for Detecting Phishing
Websites [12.468922937529966]
PhishZipは、圧縮アルゴリズムを用いてウェブサイト分類を行う新しいフィッシング検出手法である。
また,機械学習に基づくフィッシング検出を大幅に改善する新しい機械学習機能として圧縮比を提案する。
論文 参考訳(メタデータ) (2020-07-22T00:32:06Z) - Phishing URL Detection Through Top-level Domain Analysis: A Descriptive
Approach [3.494620587853103]
本研究では,Splunkプラットフォーム内で使用可能な不正なURLを検出する機械学習モデルを開発することを目的とする。
文学における同様のアプローチから着想を得た私たちは、悪意のあるデータセットと良心的なデータセットを使用して、SVMとランダムフォレストアルゴリズムを訓練しました。
我々はアルゴリズムの性能を精度とリコールで評価し,ランダムフォレストの場合,最大85%の精度と87%のリコールを達成した。
論文 参考訳(メタデータ) (2020-05-13T21:41:29Z) - High Accuracy Phishing Detection Based on Convolutional Neural Networks [0.0]
本研究では,フィッシングサイトを高精度に検出する深層学習手法を提案する。
提案手法は畳み込みニューラルネットワーク(CNN)を用いて高精度な分類を行う。
我々は6,157件の真偽と4,898件のフィッシングサイトから得られたデータセットを用いてモデルを評価する。
論文 参考訳(メタデータ) (2020-04-08T12:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。