論文の概要: WebGuard++:Interpretable Malicious URL Detection via Bidirectional Fusion of HTML Subgraphs and Multi-Scale Convolutional BERT
- arxiv url: http://arxiv.org/abs/2506.19356v1
- Date: Tue, 24 Jun 2025 06:36:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.516477
- Title: WebGuard++:Interpretable Malicious URL Detection via Bidirectional Fusion of HTML Subgraphs and Multi-Scale Convolutional BERT
- Title(参考訳): WebGuard++:HTMLサブグラフとマルチスケール畳み込みBERTの双方向融合による解釈可能な悪意URL検出
- Authors: Ye Tian, Zhang Yumin, Yifan Jia, Jianguo Sun, Yanbin Wang,
- Abstract要約: URL+ HTML機能融合は、攻撃者のアーティファクトがDOM構造に持続するため、堅牢な悪意のあるURL検出を約束する。
4つの新しいコンポーネントを持つ検出フレームワークであるWebGuard++を紹介します。
実験によると、WebGuard++は最先端のベースラインよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 3.6220178465092503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: URL+HTML feature fusion shows promise for robust malicious URL detection, since attacker artifacts persist in DOM structures. However, prior work suffers from four critical shortcomings: (1) incomplete URL modeling, failing to jointly capture lexical patterns and semantic context; (2) HTML graph sparsity, where threat-indicative nodes (e.g., obfuscated scripts) are isolated amid benign content, causing signal dilution during graph aggregation; (3) unidirectional analysis, ignoring URL-HTML feature bidirectional interaction; and (4) opaque decisions, lacking attribution to malicious DOM components. To address these challenges, we present WebGuard++, a detection framework with 4 novel components: 1) Cross-scale URL Encoder: Hierarchically learns local-to-global and coarse to fine URL features based on Transformer network with dynamic convolution. 2) Subgraph-aware HTML Encoder: Decomposes DOM graphs into interpretable substructures, amplifying sparse threat signals via Hierarchical feature fusion. 3) Bidirectional Coupling Module: Aligns URL and HTML embeddings through cross-modal contrastive learning, optimizing inter-modal consistency and intra-modal specificity. 4) Voting Module: Localizes malicious regions through consensus voting on malicious subgraph predictions. Experiments show WebGuard++ achieves significant improvements over state-of-the-art baselines, achieving 1.1x-7.9x higher TPR at fixed FPR of 0.001 and 0.0001 across both datasets.
- Abstract(参考訳): URL+HTML機能融合は、攻撃者のアーティファクトがDOM構造に持続するため、堅牢な悪意のあるURL検出を約束する。
しかし,従来の作業では,(1)非完全URLモデリング,(2)語彙パターンとセマンティックコンテキストの同時キャプチャの欠如,(2)脅威指示ノード(例えば,難読化スクリプト)が良性コンテンツの中で分離され,グラフ集約中に信号が希釈される,3)一方向解析,URL-HTML機能の双方向インタラクションを無視した,(4)悪意のあるDOMコンポーネントへの帰属を欠いた不透明な決定,という4つの重大な欠点があった。
これらの課題に対処するため、私たちは4つの新しいコンポーネントを持つ検出フレームワークであるWebGuard++を紹介した。
1) クロススケールなURLエンコーダ: 階層的にローカルからグローバルに学習し,動的畳み込みを伴うTransformerネットワークに基づく細かなURL機能を実現する。
2) サブグラフ対応HTMLエンコーダ: DOMグラフを解釈可能なサブ構造に分解し,階層的特徴融合によるスパース脅威信号の増幅を行う。
3)双方向結合モジュール: クロスモーダルコントラスト学習を通じてURLとHTMLの埋め込みをアライメントし,モーダル間の一貫性とモーダル内特異性を最適化する。
4)投票モジュール:悪意のあるサブグラフ予測に関する合意投票を通じて悪意のあるリージョンをローカライズする。
実験の結果、WebGuard++は最先端のベースラインを大幅に改善し、両方のデータセットで0.001と0.0001の固定FPRで1.1x-7.9倍高いTPRを達成した。
関連論文リスト
- SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.079013202051094]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文 参考訳(メタデータ) (2024-07-03T15:30:45Z) - DGMamba: Domain Generalization via Generalized State Space Model [80.82253601531164]
ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-11T14:35:59Z) - RAGFormer: Learning Semantic Attributes and Topological Structure for Fraud Detection [8.050935113945428]
本稿では,transFormer(RAGFormer)を用いたRelation-Aware GNNという新しいフレームワークを提案する。
RAGFormerはセマンティック機能とトポロジ機能の両方をターゲットノードに埋め込む。
単純なネットワークはセマンティックエンコーダ、トポロジーエンコーダ、アテンション融合モジュールで構成される。
論文 参考訳(メタデータ) (2024-02-27T12:53:15Z) - TransURL: Improving malicious URL detection with multi-layer Transformer encoding and multi-scale pyramid features [9.873643699502853]
本稿では,悪意のあるURL検出のための新しい手法であるTransURLを提案する。
この方法は、3つの特徴モジュールで文字認識変換器を協調訓練することで実現される。
実験の結果, 従来の方法と比較して有意な改善が認められた。
論文 参考訳(メタデータ) (2023-12-01T11:27:00Z) - PMANet: Malicious URL detection via post-trained language model guided multi-level feature attention network [16.73322002436809]
PMANetは,事前学習型言語モデル誘導型マルチレベル特徴注意ネットワークである。
PMANetは、マスク付き言語モデリング、ノイズの多い言語モデリング、ドメイン識別という、3つの自己組織化された目標を持つポストトレーニングプロセスを採用している。
小規模データ、クラス不均衡、敵攻撃を含む様々なシナリオの実験は、PMANetが最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-21T06:23:08Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Attentive WaveBlock: Complementarity-enhanced Mutual Networks for
Unsupervised Domain Adaptation in Person Re-identification and Beyond [97.25179345878443]
本稿では,新しい軽量モジュールであるAttentive WaveBlock (AWB)を提案する。
AWBは相互学習の二重ネットワークに統合され、相互学習の相補性を高め、擬似ラベルのノイズをさらに抑えることができる。
実験により, 提案手法は, 複数のUDA人物再識別タスクを大幅に改善し, 最先端の性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-06-11T15:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。