論文の概要: Deep Reinforcement Learning for Phishing Detection with Transformer-Based Semantic Features
- arxiv url: http://arxiv.org/abs/2512.06925v1
- Date: Sun, 07 Dec 2025 17:08:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.592368
- Title: Deep Reinforcement Learning for Phishing Detection with Transformer-Based Semantic Features
- Title(参考訳): 変圧器に基づく意味的特徴を用いたフィッシング検出のための深部強化学習
- Authors: Aseer Al Faisal,
- Abstract要約: フィッシング(英: Phishing)とは、個人が個人情報を明らかにすることを欺くサイバー犯罪である。
本研究では,RoBERTaセマンティック埋め込みを手作り語彙特徴と統合したQuantile Deep Q-Network (QR-DQN)アプローチを提案する。
PhishTank、OpenPhish、Cloudflare、その他のソースから105,000のURLのさまざまなデータセットが収集された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Phishing is a cybercrime in which individuals are deceived into revealing personal information, often resulting in financial loss. These attacks commonly occur through fraudulent messages, misleading advertisements, and compromised legitimate websites. This study proposes a Quantile Regression Deep Q-Network (QR-DQN) approach that integrates RoBERTa semantic embeddings with handcrafted lexical features to enhance phishing detection while accounting for uncertainties. Unlike traditional DQN methods that estimate single scalar Q-values, QR-DQN leverages quantile regression to model the distribution of returns, improving stability and generalization on unseen phishing data. A diverse dataset of 105,000 URLs was curated from PhishTank, OpenPhish, Cloudflare, and other sources, and the model was evaluated using an 80/20 train-test split. The QR-DQN framework achieved a test accuracy of 99.86%, precision of 99.75%, recall of 99.96%, and F1-score of 99.85%, demonstrating high effectiveness. Compared to standard DQN with lexical features, the hybrid QR-DQN with lexical and semantic features reduced the generalization gap from 1.66% to 0.04%, indicating significant improvement in robustness. Five-fold cross-validation confirmed model reliability, yielding a mean accuracy of 99.90% with a standard deviation of 0.04%. These results suggest that the proposed hybrid approach effectively identifies phishing threats, adapts to evolving attack strategies, and generalizes well to unseen data.
- Abstract(参考訳): フィッシング(英: Phishing)とは、個人が個人情報を漏らし、しばしば金銭的損失をもたらすサイバー犯罪である。
これらの攻撃は通常、不正なメッセージ、広告の誤解を招くこと、合法的なウェブサイトを侵害することを通じて起こる。
本研究は,RoBERTaセマンティック埋め込みを手作り語彙特徴と統合し,不確実性を考慮しつつフィッシング検出を向上させる,量子回帰深度Q-Network (QR-DQN) アプローチを提案する。
単一スカラーQ値を推定する従来のDQN法とは異なり、QR-DQNは量子レグレッションを利用してリターンの分布をモデル化し、不安定なフィッシングデータに対する安定性と一般化を改善する。
さまざまな105,000のURLのデータセットがPhishTank、OpenPhish、Cloudflareなどのソースから収集され、モデルが80/20のトレインテストスプリットを使用して評価された。
QR-DQNフレームワークは99.86%、精度99.75%、リコール99.96%、F1スコア99.85%を達成し、高い有効性を示した。
語彙的特徴を持つ標準DQNと比較して、語彙的特徴と意味的特徴を持つハイブリッドQR-DQNは一般化のギャップを1.66%から0.04%に減らし、堅牢性を大幅に改善した。
5倍のクロスバリデーションはモデルの信頼性を確認し、平均精度は99.90%、標準偏差は0.04%である。
これらの結果から,提案手法はフィッシングの脅威を効果的に識別し,攻撃戦略の進化に適応し,見当たらないデータに適応することが示唆された。
関連論文リスト
- CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - Hybrid Reputation Aggregation: A Robust Defense Mechanism for Adversarial Federated Learning in 5G and Edge Network Environments [0.0]
5Gおよびエッジネットワーク環境におけるフェデレートラーニング(FL)は、敵のクライアントによる深刻なセキュリティ脅威に直面します。
本稿では,攻撃タイプを事前に知ることなく,FLにおける敵の動作を防御する,新しいロバストアグリゲーション機構であるHybrid Reputation Aggregation(HRA)を紹介する。
HRAは、幾何学的異常検出と、モーメントに基づくクライアントの評判追跡を組み合わせる。
論文 参考訳(メタデータ) (2025-09-22T17:18:59Z) - Phishing URL Detection using Bi-LSTM [0.0]
本稿では,URLを4つのカテゴリに分類する深層学習に基づくアプローチを提案する。
650,000以上のURLからなるデータセットの実験結果は、モデルの有効性を示し、97%の精度と従来の技術よりも大幅に改善された。
論文 参考訳(メタデータ) (2025-04-29T00:55:01Z) - A Gradient-Optimized TSK Fuzzy Framework for Explainable Phishing Detection [0.0]
既存のフィッシング検出手法は高い精度と説明可能性の両立に苦慮している。
勾配に基づく手法により最適化された1次高木・スゲノ・カンファジィ推論モデルに基づく新しいフィッシングURL検出システムを提案する。
論文 参考訳(メタデータ) (2025-04-25T18:31:05Z) - Browser Extension for Fake URL Detection [0.0]
本稿では、機械学習モデルを用いてオンラインセキュリティを強化するBrowser Extensionを提案する。
提案手法はPhishing Webサイトの分類にLGBM分類器を用いる。
スパムメール検出のためのModel for Spamは、5500以上のメッセージを持つデータセットでトレーニングされたマルチノードNBアルゴリズムを使用している。
論文 参考訳(メタデータ) (2024-11-16T07:22:59Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - G$^2$uardFL: Safeguarding Federated Learning Against Backdoor Attacks
through Attributed Client Graph Clustering [116.4277292854053]
Federated Learning (FL)は、データ共有なしで協調的なモデルトレーニングを提供する。
FLはバックドア攻撃に弱いため、有害なモデル重みがシステムの整合性を損なう。
本稿では、悪意のあるクライアントの識別を属性グラフクラスタリング問題として再解釈する保護フレームワークであるG$2$uardFLを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:15:04Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - High Accuracy Phishing Detection Based on Convolutional Neural Networks [0.0]
本研究では,フィッシングサイトを高精度に検出する深層学習手法を提案する。
提案手法は畳み込みニューラルネットワーク(CNN)を用いて高精度な分類を行う。
我々は6,157件の真偽と4,898件のフィッシングサイトから得られたデータセットを用いてモデルを評価する。
論文 参考訳(メタデータ) (2020-04-08T12:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。