論文の概要: Enhancing Phishing Detection through Feature Importance Analysis and Explainable AI: A Comparative Study of CatBoost, XGBoost, and EBM Models
- arxiv url: http://arxiv.org/abs/2411.06860v1
- Date: Mon, 11 Nov 2024 10:49:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:10:36.857798
- Title: Enhancing Phishing Detection through Feature Importance Analysis and Explainable AI: A Comparative Study of CatBoost, XGBoost, and EBM Models
- Title(参考訳): 特徴重要度分析と説明可能なAIによるフィッシング検出の強化:CatBoost, XGBoost, EBMモデルの比較検討
- Authors: Abdullah Fajar, Setiadi Yazid, Indra Budi,
- Abstract要約: 本研究では,フィッシングURLの識別に機械学習を用いることを検討した。
パフォーマンス向上のために、機能選択とモデル解釈可能性の重要な役割を強調します。
この研究は、CatBoost、XGBoost、Explainable Boosting Machineなど、さまざまなアルゴリズムを評価した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Phishing attacks remain a persistent threat to online security, demanding robust detection methods. This study investigates the use of machine learning to identify phishing URLs, emphasizing the crucial role of feature selection and model interpretability for improved performance. Employing Recursive Feature Elimination, the research pinpointed key features like "length_url," "time_domain_activation" and "Page_rank" as strong indicators of phishing attempts. The study evaluated various algorithms, including CatBoost, XGBoost, and Explainable Boosting Machine, assessing their robustness and scalability. XGBoost emerged as highly efficient in terms of runtime, making it well-suited for large datasets. CatBoost, on the other hand, demonstrated resilience by maintaining high accuracy even with reduced features. To enhance transparency and trustworthiness, Explainable AI techniques, such as SHAP, were employed to provide insights into feature importance. The study's findings highlight that effective feature selection and model interpretability can significantly bolster phishing detection systems, paving the way for more efficient and adaptable defenses against evolving cyber threats
- Abstract(参考訳): フィッシング攻撃は、オンラインセキュリティに対する永続的な脅威であり、堅牢な検出方法を必要としている。
本研究では、フィッシングURLの識別に機械学習を用いることについて検討し、性能向上のための特徴選択とモデル解釈可能性の重要性を強調した。
Recursive Feature Eliminationを使って、研究はフィッシングの試みの強力な指標として、"length_url"、"time_ domain_activation"、"Page_rank"といった重要な特徴を指摘した。
この研究は、CatBoost、XGBoost、Explainable Boosting Machineなどの様々なアルゴリズムを評価し、その堅牢性とスケーラビリティを評価した。
XGBoostは実行時に非常に効率的で、大規模なデータセットに適している。
一方、CatBoostは、性能が低下しても高い精度を維持することでレジリエンスを実証した。
透明性と信頼性を高めるため、SHAPのような説明可能なAI技術が採用され、機能の重要性に関する洞察を提供する。
この研究の結果は、効果的な特徴選択とモデル解釈可能性によってフィッシング検出システムを著しく強化し、進化するサイバー脅威に対してより効率的で適応可能な防御手段を構築することができることを強調している。
関連論文リスト
- Exploring Feature Importance and Explainability Towards Enhanced ML-Based DoS Detection in AI Systems [3.3150909292716477]
Denial of Service(DoS)攻撃は、AIシステムセキュリティの領域において重大な脅威となる。
統計的および機械学習(ML)に基づくDoS分類と検出アプローチは、幅広い特徴選択メカニズムを使用して、ネットワークトラフィックデータセットから特徴サブセットを選択する。
本稿では,MLによるDoS攻撃検出における特徴選択の重要性について検討する。
論文 参考訳(メタデータ) (2024-11-04T19:51:08Z) - Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.53065398127086]
本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。
我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。
提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文 参考訳(メタデータ) (2024-09-25T09:50:51Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - PhishGuard: A Convolutional Neural Network Based Model for Detecting Phishing URLs with Explainability Analysis [1.102674168371806]
フィッシングURLの識別は、この問題に対処する最善の方法だ。
フィッシングURLの検出を自動化するために,機械学習と深層学習の手法が提案されている。
本稿では,1次元畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2024-04-27T17:13:49Z) - AntiPhishStack: LSTM-based Stacked Generalization Model for Optimized
Phishing URL Detection [0.32141666878560626]
本稿では,フィッシングサイトを検出するための2相スタック一般化モデルであるAntiPhishStackを提案する。
このモデルは、URLと文字レベルのTF-IDF特徴の学習を対称的に活用し、新たなフィッシング脅威に対処する能力を高める。
良性およびフィッシングまたは悪意のあるURLを含む2つのベンチマークデータセットに対する実験的検証は、既存の研究と比較して96.04%の精度で、このモデルの例外的な性能を示している。
論文 参考訳(メタデータ) (2024-01-17T03:44:27Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - Clustering Effect of (Linearized) Adversarial Robust Models [60.25668525218051]
本稿では, 敵の強靭性に対する新たな理解を提案し, ドメイン適応や頑健性向上といったタスクに適用する。
提案したクラスタリング戦略の合理性と優越性を実験的に評価した。
論文 参考訳(メタデータ) (2021-11-25T05:51:03Z) - Utilising Flow Aggregation to Classify Benign Imitating Attacks [0.0]
多くのアプリケーションにおいて、機能の選択はモデルの選択よりも重要である。
様々な研究が、良質なトラフィックと有名なサイバー攻撃を区別しようと試みている。
ネットワークトラフィックのより高度な抽象化に基づく新機能を紹介します。
論文 参考訳(メタデータ) (2021-03-06T23:09:12Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Graph Backdoor [53.70971502299977]
GTAはグラフニューラルネットワーク(GNN)に対する最初のバックドア攻撃である。
GTAは、トポロジカル構造と記述的特徴の両方を含む特定の部分グラフとしてトリガーを定義する。
トランスダクティブ(ノード分類など)とインダクティブ(グラフ分類など)の両方のタスクに対してインスタンス化することができる。
論文 参考訳(メタデータ) (2020-06-21T19:45:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。