論文の概要: Phishing Attacks and Websites Classification Using Machine Learning and
Multiple Datasets (A Comparative Analysis)
- arxiv url: http://arxiv.org/abs/2101.02552v1
- Date: Wed, 6 Jan 2021 08:23:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 05:57:59.539515
- Title: Phishing Attacks and Websites Classification Using Machine Learning and
Multiple Datasets (A Comparative Analysis)
- Title(参考訳): 機械学習と複数データセットを用いたフィッシング攻撃とwebサイト分類(比較分析)
- Authors: Sohail Ahmed Khan and Wasiq Khan and Abir Hussain
- Abstract要約: フィッシング攻撃は機密情報を得るために使用される最も一般的なサイバー攻撃である。
近年,フィッシング攻撃,特にマシンインテリジェンスの展開を識別するために,様々な手法が提案されている。
本稿では,機械学習アルゴリズムを総合的に分析し,その性能を複数のデータセットで評価する。
- 参考スコア(独自算出の注目度): 2.268853004164586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing attacks are the most common type of cyber-attacks used to obtain
sensitive information and have been affecting individuals as well as
organisations across the globe. Various techniques have been proposed to
identify the phishing attacks specifically, deployment of machine intelligence
in recent years. However, the deployed algorithms and discriminating factors
are very diverse in existing works. In this study, we present a comprehensive
analysis of various machine learning algorithms to evaluate their performances
over multiple datasets. We further investigate the most significant features
within multiple datasets and compare the classification performance with the
reduced dimensional datasets. The statistical results indicate that random
forest and artificial neural network outperform other classification
algorithms, achieving over 97% accuracy using the identified features.
- Abstract(参考訳): フィッシング攻撃は機密情報を得るために使用される最も一般的なサイバー攻撃であり、世界中の個人や組織に影響を与える。
近年,フィッシング攻撃,特にマシンインテリジェンスの展開を識別するために,様々な手法が提案されている。
しかし、既存の作業では、デプロイアルゴリズムと識別要因が非常に多様である。
本研究では,機械学習アルゴリズムを網羅的に分析し,その性能を複数のデータセットで評価する。
我々は,複数のデータセットにおける最も重要な特徴をさらに調査し,その分類性能を縮小した次元データセットと比較する。
統計的には、ランダムフォレストとニューラルネットワークは他の分類アルゴリズムよりも優れており、同定された特徴を用いて97%以上の精度を達成している。
関連論文リスト
- The importance of the clustering model to detect new types of intrusion in data traffic [0.0]
提案手法では,クラスタリング手法としてK-meansアルゴリズムを用いる。
データはKali Linux環境、cicflowmeterトラフィック、Putty Softwareツールを利用して収集された。
モデルは攻撃を数え、それぞれに番号を割り当てた。
論文 参考訳(メタデータ) (2024-11-21T19:40:31Z) - Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - A Sophisticated Framework for the Accurate Detection of Phishing Websites [0.0]
フィッシング(英: Phishing)は、ますます洗練されたサイバー攻撃形態であり、世界中の企業に巨額の経済的損害を与えている。
本稿では,フィッシングサイトを検出するための包括的手法を提案する。
特徴選択, 欲求アルゴリズム, クロスバリデーション, 深層学習を組み合わせて, 洗練された積み重ねアンサンブルを構築している。
論文 参考訳(メタデータ) (2024-03-13T14:26:25Z) - On the Cross-Dataset Generalization of Machine Learning for Network
Intrusion Detection [50.38534263407915]
ネットワーク侵入検知システム(NIDS)はサイバーセキュリティの基本的なツールである。
多様なネットワークにまたがる一般化能力は、その有効性と現実のアプリケーションにとって必須の要素である。
本研究では,機械学習に基づくNIDSの一般化に関する包括的分析を行う。
論文 参考訳(メタデータ) (2024-02-15T14:39:58Z) - Investigating Human-Identifiable Features Hidden in Adversarial
Perturbations [54.39726653562144]
我々の研究では、最大5つの攻撃アルゴリズムを3つのデータセットにわたって探索する。
対人摂動における人間の識別可能な特徴を同定する。
画素レベルのアノテーションを用いて、そのような特徴を抽出し、ターゲットモデルに妥協する能力を実証する。
論文 参考訳(メタデータ) (2023-09-28T22:31:29Z) - Multi-Dimensional Ability Diagnosis for Machine Learning Algorithms [88.93372675846123]
本稿では,機械学習アルゴリズム評価のためのタスク非依存評価フレームワークCamillaを提案する。
認識診断の仮定とニューラルネットワークを用いて、各サンプルのアルゴリズム、サンプル、スキル間の複雑な相互作用を学習する。
我々の実験では、カミラはメートル法信頼性、ランクの整合性、ランクの安定性で最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-14T03:15:56Z) - A Meta-level Analysis of Online Anomaly Detectors [4.852567314334134]
ストリーミングデータにおける異常のリアルタイム検出が注目されている。
しかし、ストリーミングデータに対する異常検出の有効性と効率を比較するには、ほとんど注意が払われていない。
本稿では,異なるアルゴリズム群から抽出した主要なオンライン検出器の質的,総合的な概要について述べる。
論文 参考訳(メタデータ) (2022-09-13T11:28:15Z) - Multi-Layer Perceptron Neural Network for Improving Detection
Performance of Malicious Phishing URLs Without Affecting Other Attack Types
Classification [0.0]
多層パーセプトロン(MLP)は、悪意のあるURLと半構造化URLを区別する際の精度が高い。
バックプロパゲーションの重量調整は、他の攻撃種とフィッシングを区別する上でより重要であるものを学ぶことができる。
論文 参考訳(メタデータ) (2022-02-25T14:36:55Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Bias in Multimodal AI: Testbed for Fair Automatic Recruitment [73.85525896663371]
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
我々は、性別や人種の偏りを意識的に評価したマルチモーダルな合成プロファイルを用いて、自動求人アルゴリズムを訓練する。
我々の方法論と結果は、一般により公平なAIベースのツール、特により公平な自動採用システムを生成する方法を示している。
論文 参考訳(メタデータ) (2020-04-15T15:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。