論文の概要: Enhance the machine learning algorithm performance in phishing detection with keyword features
- arxiv url: http://arxiv.org/abs/2508.09765v1
- Date: Tue, 12 Aug 2025 14:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.886873
- Title: Enhance the machine learning algorithm performance in phishing detection with keyword features
- Title(参考訳): キーワード付きフィッシング検出における機械学習アルゴリズムの性能向上
- Authors: Zijiang Yang,
- Abstract要約: 典型的なフィッシング攻撃では、攻撃者はエンドユーザーの情報を取得するために、正当なウェブサイトに似た悪意のあるウェブサイトをセットアップする。
従来の研究者は、フィッシングURLと正当なURLを区別するために、多くの機械学習アルゴリズムを提案してきた。
従来の特徴にキーワードを組み込む新しい手法を提案する。
- 参考スコア(独自算出の注目度): 1.7487745673871375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, we can observe a significant increase of the phishing attacks in the Internet. In a typical phishing attack, the attacker sets up a malicious website that looks similar to the legitimate website in order to obtain the end-users' information. This may cause the leakage of the sensitive information and the financial loss for the end-users. To avoid such attacks, the early detection of these websites' URLs is vital and necessary. Previous researchers have proposed many machine learning algorithms to distinguish the phishing URLs from the legitimate ones. In this paper, we would like to enhance these machine learning algorithms from the perspective of feature selection. We propose a novel method to incorporate the keyword features with the traditional features. This method is applied on multiple traditional machine learning algorithms and the experimental results have shown this method is useful and effective. On average, this method can reduce the classification error by 30% for the large dataset. Moreover, its enhancement is more significant for the small dataset. In addition, this method extracts the information from the URL and does not rely on the additional information provided by the third-part service. The best result for the machine learning algorithm using our proposed method has achieved the accuracy of 99.68%.
- Abstract(参考訳): 近年,インターネットにおけるフィッシング攻撃の著しい増加が観察されている。
典型的なフィッシング攻撃では、攻撃者はエンドユーザーの情報を取得するために、正当なウェブサイトに似た悪意のあるウェブサイトをセットアップする。
これは、機密情報の漏洩と、エンドユーザーにとっての金銭的損失を引き起こす可能性がある。
このような攻撃を避けるためには、これらのウェブサイトのURLの早期発見が不可欠であり、必要である。
従来の研究者は、フィッシングURLと正当なURLを区別するために、多くの機械学習アルゴリズムを提案してきた。
本稿では,特徴選択の観点から,これらの機械学習アルゴリズムを拡張したい。
従来の特徴にキーワードを組み込む新しい手法を提案する。
本手法を従来の機械学習アルゴリズムに適用し,本手法が有用かつ有効であることを示す実験結果を得た。
この方法では,大規模データセットの分類誤差を30%削減できる。
さらに、小さなデータセットでは、その拡張がより重要である。
さらに、この方法はURLから情報を抽出し、サードパーティサービスが提供する追加情報に依存しない。
提案手法を用いた機械学習アルゴリズムでは,99.68%の精度が得られた。
関連論文リスト
- RESTOR: Knowledge Recovery in Machine Unlearning [71.75834077528305]
Webスケールコーパスでトレーニングされた大規模な言語モデルは、プライベートまたはセンシティブな情報を含むことができる。
このようなデータポイントの効果を排除するために、いくつかの機械学習アルゴリズムが提案されている。
機械学習評価のためのRESTORフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-31T20:54:35Z) - A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0]
フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文 参考訳(メタデータ) (2024-03-13T14:26:25Z) - Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - An Innovative Information Theory-based Approach to Tackle and Enhance The Transparency in Phishing Detection [23.962076093344166]
フィッシングアタックローカライゼーションのための革新的な深層学習手法を提案する。
本手法は,メールデータの脆弱性を予測するだけでなく,最も重要なフィッシング関連情報を自動的に学習し,発見する。
論文 参考訳(メタデータ) (2024-02-27T00:03:07Z) - An Adversarial Attack Analysis on Malicious Advertisement URL Detection
Framework [22.259444589459513]
悪意のある広告URLは、サイバー攻撃の源泉であるため、セキュリティ上のリスクをもたらす。
既存の悪意のあるURL検出技術は制限されており、見えない機能やテストデータの一般化を扱うことができる。
本研究では,新しい語彙・ウェブスクラップ機能群を抽出し,機械学習技術を用いて不正広告URL検出システムを構築する。
論文 参考訳(メタデータ) (2022-04-27T20:06:22Z) - Phishing Attacks Detection -- A Machine Learning-Based Approach [0.6445605125467573]
フィッシング攻撃は、ユーザーのメールが機密で機密性の高い情報を不正に盗むことを目的とした、最も一般的なソーシャルエンジニアリング攻撃の1つだ。
本稿では,機械学習に基づくフィッシング攻撃検出手法を提案する。
ノースダコタ大学のメールサービスを対象とした4000件以上のフィッシングメールを収集し分析した。
論文 参考訳(メタデータ) (2022-01-26T05:08:27Z) - Deep convolutional forest: a dynamic deep ensemble approach for spam
detection in text [219.15486286590016]
本稿では,スパム検出のための動的深層アンサンブルモデルを提案する。
その結果、このモデルは高い精度、リコール、f1スコア、98.38%の精度を達成した。
論文 参考訳(メタデータ) (2021-10-10T17:19:37Z) - Information Theoretic Meta Learning with Gaussian Processes [74.54485310507336]
情報理論の概念,すなわち相互情報と情報のボトルネックを用いてメタ学習を定式化する。
相互情報に対する変分近似を用いることで、メタ学習のための汎用的かつトラクタブルな枠組みを導出する。
論文 参考訳(メタデータ) (2020-09-07T16:47:30Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Cyber Attack Detection thanks to Machine Learning Algorithms [0.0]
本稿では、ネットワーク内の悪意のあるトラフィックを分類する能力を調べることによって、機械学習を実現可能なソリューションとして検討する。
提案手法は,共通ボットネットを含むNetFlowデータセットに対して,5種類の機械学習アルゴリズムを解析する。
ランダムフォレストは13のシナリオのうち8つで95%以上のボットネットを検出し、最も難しいデータセットでは55%以上を検知することに成功した。
論文 参考訳(メタデータ) (2020-01-17T13:52:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。