論文の概要: Malicious URL Detection via Pretrained Language Model Guided Multi-Level Feature Attention Network
- arxiv url: http://arxiv.org/abs/2311.12372v1
- Date: Tue, 21 Nov 2023 06:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 13:26:22.776703
- Title: Malicious URL Detection via Pretrained Language Model Guided Multi-Level Feature Attention Network
- Title(参考訳): 複数レベル特徴注意ネットワークを用いた事前学習型言語モデルによる悪質URL検出
- Authors: Ruitong Liu, Yanbin Wang, Haitao Xu, Zhan Qin, Yiwei Liu, Zheng Cao,
- Abstract要約: 本稿では、悪質なURL検出のための効率的な事前学習モデルベースのフレームワークを提案する。
階層的特徴抽出,層認識型注意,空間ピラミッドプールの3つの重要なモジュールを開発した。
提案手法は複数の公開データセットに対して広範囲に検証されている。
- 参考スコア(独自算出の注目度): 15.888763097896339
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread use of the Internet has revolutionized information retrieval methods. However, this transformation has also given rise to a significant cybersecurity challenge: the rapid proliferation of malicious URLs, which serve as entry points for a wide range of cyber threats. In this study, we present an efficient pre-training model-based framework for malicious URL detection. Leveraging the subword and character-aware pre-trained model, CharBERT, as our foundation, we further develop three key modules: hierarchical feature extraction, layer-aware attention, and spatial pyramid pooling. The hierarchical feature extraction module follows the pyramid feature learning principle, extracting multi-level URL embeddings from the different Transformer layers of CharBERT. Subsequently, the layer-aware attention module autonomously learns connections among features at various hierarchical levels and allocates varying weight coefficients to each level of features. Finally, the spatial pyramid pooling module performs multiscale downsampling on the weighted multi-level feature pyramid, achieving the capture of local features as well as the aggregation of global features. The proposed method has been extensively validated on multiple public datasets, demonstrating a significant improvement over prior works, with the maximum accuracy gap reaching 8.43% compared to the previous state-of-the-art method. Additionally, we have assessed the model's generalization and robustness in scenarios such as cross-dataset evaluation and adversarial attacks. Finally, we conducted real-world case studies on the active phishing URLs.
- Abstract(参考訳): インターネットの普及は情報検索法に革命をもたらした。
しかし、このトランスフォーメーションは重要なサイバーセキュリティの課題も生み出した。悪意のあるURLが急速に急増し、幅広いサイバー脅威のエントリポイントとして機能する。
本研究では,悪質なURL検出のための学習前モデルに基づく効率的なフレームワークを提案する。
サブワードと文字認識事前学習モデルCharBERTを基盤として,階層的特徴抽出,層認識,空間的ピラミッドプールという3つの重要なモジュールを開発した。
階層的な特徴抽出モジュールはピラミッドの特徴学習の原則に従い、CharBERTの異なるトランスフォーマー層から多層URLの埋め込みを抽出する。
その後、層認識アテンションモジュールは、様々な階層レベルで特徴間の接続を自律的に学習し、各特徴レベルに様々な重み係数を割り当てる。
最後に、空間ピラミッドプーリングモジュールは、重み付けされた多層特徴ピラミッド上でマルチスケールのダウンサンプリングを行い、局所的な特徴の捕捉とグローバルな特徴の集約を達成する。
提案手法は複数の公開データセットに対して広範囲に検証され,従来の最先端手法と比較して,最大精度ギャップが8.43%に達するなど,先行処理よりも大幅に改善されている。
さらに,クロスデータセット評価や敵攻撃といったシナリオにおいて,モデルの一般化とロバスト性を評価した。
最後に,アクティブフィッシングURLについて実世界のケーススタディを行った。
関連論文リスト
- An Advanced Deep Learning Based Three-Stream Hybrid Model for Dynamic Hand Gesture Recognition [1.7985212575295124]
本稿では,RGBピクセルとスケルトンベースの特徴を組み合わせた3ストリームハイブリッドモデルを提案する。
手順では、拡張を含むデータセットを前処理し、回転、翻訳、独立系をスケールしました。
主に,画素ベースの深層学習機能とpos推定ベースの積み重ね深層学習機能を利用して,強力な特徴ベクトルを作成した。
論文 参考訳(メタデータ) (2024-08-15T09:05:00Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - PyraTrans: Attention-Enriched Pyramid Transformer for Malicious URL Detection [9.873643699502853]
PyraTransは、事前訓練されたトランスフォーマーとピラミッド特徴学習を統合して、悪意のあるURLを検出する新しい方法である。
いくつかの挑戦的な実験シナリオにおいて、提案手法は精度、一般化、堅牢性を著しく改善した。
論文 参考訳(メタデータ) (2023-12-01T11:27:00Z) - M$^3$Net: Multilevel, Mixed and Multistage Attention Network for Salient
Object Detection [22.60675416709486]
M$3$Netは、Salient Object Detectionのためのアテンションネットワークである。
マルチレベル特徴間の相互作用を実現するためのクロスアテンションアプローチ。
Mixed Attention Blockは、グローバルレベルとローカルレベルの両方でコンテキストをモデリングすることを目的としている。
集約された特徴をステージごとに最適化するためのマルチレベル監視戦略。
論文 参考訳(メタデータ) (2023-09-15T12:46:14Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Bifurcated backbone strategy for RGB-D salient object detection [168.19708737906618]
我々は、RGB-Dの高次物体検出に固有のマルチモーダル・マルチレベルの性質を活用して、新しいカスケードリファインメントネットワークを考案する。
アーキテクチャは Bifurcated Backbone Strategy Network (BBS-Net) と呼ばれ、シンプルで効率的でバックボーンに依存しない。
論文 参考訳(メタデータ) (2020-07-06T13:01:30Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。