論文の概要: Phishing Detection System: An Ensemble Approach Using Character-Level CNN and Feature Engineering
- arxiv url: http://arxiv.org/abs/2512.16717v1
- Date: Thu, 18 Dec 2025 16:19:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.153482
- Title: Phishing Detection System: An Ensemble Approach Using Character-Level CNN and Feature Engineering
- Title(参考訳): フィッシング検出システム:文字レベルCNNと特徴工学を用いたアンサンブルアプローチ
- Authors: Rudra Dubey, Arpit Mani Tripathi, Archit Srivastava, Sarvpal Singh,
- Abstract要約: 本稿では,フィッシング検出システムのためのAIモデルを提案する。
アンサンブルアプローチを使用して、文字レベルの畳み込みニューラルネットワーク(CNN)とLightGBMをエンジニアリング機能と組み合わせている。
19,873URLのテストデータセットでは、アンサンブルの精度は99.819パーセント、精度は100%、リコールは99.635パーセント、ROC-AUCは99.947パーセントである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In actuality, phishing attacks remain one of the most prevalent cybersecurity risks in existence today, with malevolent actors constantly changing their strategies to successfully trick users. This paper presents an AI model for a phishing detection system that uses an ensemble approach to combine character-level Convolutional Neural Networks (CNN) and LightGBM with engineered features. Our system uses a character-level CNN to extract sequential features after extracting 36 lexical, structural, and domain-based features from the URLs. On a test dataset of 19,873 URLs, the ensemble model achieves an accuracy of 99.819 percent, precision of 100 percent, recall of 99.635 percent, and ROC-AUC of 99.947 percent. Through a FastAPI-based service with an intuitive user interface, the suggested system has been utilised to offer real-time detection. In contrast, the results demonstrate that the suggested solution performs better than individual models; LightGBM contributes 40 percent and character-CNN contributes 60 percent to the final prediction. The suggested method maintains extremely low false positive rates while doing a good job of identifying contemporary phishing techniques. Index Terms - Phishing detection, machine learning, deep learning, CNN, ensemble methods, cybersecurity, URL analysis
- Abstract(参考訳): 実際、フィッシング攻撃は現在も最も一般的なサイバーセキュリティのリスクの1つであり、悪意あるアクターはユーザーを騙すために戦略を常に変更している。
本稿では,文字レベル畳み込みニューラルネットワーク(CNN)とLightGBMを組み合わせたアンサンブルアプローチを用いたフィッシング検出システムのためのAIモデルを提案する。
本システムでは,URLから36の語彙的,構造的,ドメイン的特徴を抽出し,文字レベルのCNNを用いて逐次的特徴を抽出する。
19,873URLのテストデータセットでは、アンサンブルの精度は99.819パーセント、精度は100%、リコールは99.635パーセント、ROC-AUCは99.947パーセントである。
直感的なユーザインターフェースを備えたFastAPIベースのサービスを通じて,提案システムはリアルタイム検出に利用されている。
対照的に、提案したソリューションは個々のモデルよりも優れており、LightGBMは40%、キャラクタCNNは最終予測に60%貢献している。
提案手法は,同時代のフィッシング技術を見極めながら,極めて低い偽陽性率を維持している。
Index Terms - フィッシング検出、機械学習、ディープラーニング、CNN、アンサンブルメソッド、サイバーセキュリティ、URL分析
関連論文リスト
- Deep Reinforcement Learning for Phishing Detection with Transformer-Based Semantic Features [0.0]
フィッシング(英: Phishing)とは、個人が個人情報を明らかにすることを欺くサイバー犯罪である。
本研究では,RoBERTaセマンティック埋め込みを手作り語彙特徴と統合したQuantile Deep Q-Network (QR-DQN)アプローチを提案する。
PhishTank、OpenPhish、Cloudflare、その他のソースから105,000のURLのさまざまなデータセットが収集された。
論文 参考訳(メタデータ) (2025-12-07T17:08:12Z) - A Graph-Attentive LSTM Model for Malicious URL Detection [0.0]
ブラックリストの検出方法は、既存のパターンに依存するため、新しいURLや難読化URLを識別できない。
本研究は,グラフニューラルネットワーク(GNN)とグラフ注意ネットワーク(GAT)とLong Short-Term Memory(LSTM)ネットワークを組み合わせた,GNN-GAT-LSTMというハイブリッドディープラーニングモデルを提案する。
このモデルは、文字がエッジを介して接続されるノードになるプロセスを通じて、URLをグラフに変換する。
論文 参考訳(メタデータ) (2025-10-12T17:10:29Z) - EXPLICATE: Enhancing Phishing Detection through Explainable AI and LLM-Powered Interpretability [44.2907457629342]
EXPLICATEは、三成分アーキテクチャによるフィッシング検出を強化するフレームワークである。
既存のディープラーニング技術と同等ですが、説明性が向上しています。
自動AIとフィッシング検出システムにおけるユーザ信頼の重大な隔たりに対処する。
論文 参考訳(メタデータ) (2025-03-22T23:37:35Z) - Browser Extension for Fake URL Detection [0.0]
本稿では、機械学習モデルを用いてオンラインセキュリティを強化するBrowser Extensionを提案する。
提案手法はPhishing Webサイトの分類にLGBM分類器を用いる。
スパムメール検出のためのModel for Spamは、5500以上のメッセージを持つデータセットでトレーニングされたマルチノードNBアルゴリズムを使用している。
論文 参考訳(メタデータ) (2024-11-16T07:22:59Z) - PhishGuard: A Convolutional Neural Network Based Model for Detecting Phishing URLs with Explainability Analysis [1.102674168371806]
フィッシングURLの識別は、この問題に対処する最善の方法だ。
フィッシングURLの検出を自動化するために,機械学習と深層学習の手法が提案されている。
本稿では,1次元畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2024-04-27T17:13:49Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - FLTracer: Accurate Poisoning Attack Provenance in Federated Learning [38.47921452675418]
Federated Learning(FL)は、複数のクライアントが共同で共有グローバルモデルをトレーニングできる、有望な分散学習アプローチである。
近年の研究では、FLは様々な毒殺攻撃に弱いことが示されており、グローバルモデルの性能を低下させるか、バックドアを導入することができる。
FLTracerは、様々な攻撃を正確に検出し、攻撃時間、目的、タイプ、および更新の有毒な位置を追跡できる最初のFL攻撃フレームワークである。
論文 参考訳(メタデータ) (2023-10-20T11:24:38Z) - PhishSim: Aiding Phishing Website Detection with a Feature-Free Tool [12.468922937529966]
正規化圧縮距離(NCD)を用いたフィッシングサイト検出のための機能フリー手法を提案する。
この尺度は2つのウェブサイトの類似性を圧縮することで計算し、特徴抽出を行う必要がなくなる。
我々はFurthest Point Firstアルゴリズムを用いてフィッシングプロトタイプ抽出を行い、フィッシングWebページのクラスタを表すインスタンスを選択する。
論文 参考訳(メタデータ) (2022-07-13T20:44:03Z) - Adversarially robust deepfake media detection using fused convolutional
neural network predictions [79.00202519223662]
現在のディープフェイク検出システムは、目に見えないデータと戦っている。
ビデオから抽出した偽画像と実画像の分類には,CNN(Deep Convolutional Neural Network)モデルが3種類採用されている。
提案手法は96.5%の精度で最先端のモデルより優れている。
論文 参考訳(メタデータ) (2021-02-11T11:28:00Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。