論文の概要: IP-Augmented Multi-Modal Malicious URL Detection Via Token-Contrastive Representation Enhancement and Multi-Granularity Fusion
- arxiv url: http://arxiv.org/abs/2510.12395v1
- Date: Tue, 14 Oct 2025 11:20:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.29153
- Title: IP-Augmented Multi-Modal Malicious URL Detection Via Token-Contrastive Representation Enhancement and Multi-Granularity Fusion
- Title(参考訳): IP-Augmented Multi-Modal Malicious URL Detection Via Token-Contrastive Representation Enhancement and Multi-Granularity Fusion
- Authors: Ye Tian, Yanqiu Yu, Liangliang Song, Zhiquan Liu, Yanbin Wang, Jianguo Sun,
- Abstract要約: 悪意のあるURL検出は依然として重要なサイバーセキュリティの課題だ。
3つの重要なイノベーションを取り入れた高度なマルチモーダル検出フレームワークであるCURL-IPを提案する。
大規模実世界のデータセットに対する我々の評価は、このフレームワークが最先端のベースラインを大幅に上回っていることを示している。
- 参考スコア(独自算出の注目度): 11.704828859661879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Malicious URL detection remains a critical cybersecurity challenge as adversaries increasingly employ sophisticated evasion techniques including obfuscation, character-level perturbations, and adversarial attacks. Although pre-trained language models (PLMs) like BERT have shown potential for URL analysis tasks, three limitations persist in current implementations: (1) inability to effectively model the non-natural hierarchical structure of URLs, (2) insufficient sensitivity to character-level obfuscation, and (3) lack of mechanisms to incorporate auxiliary network-level signals such as IP addresses-all essential for robust detection. To address these challenges, we propose CURL-IP, an advanced multi-modal detection framework incorporating three key innovations: (1) Token-Contrastive Representation Enhancer, which enhances subword token representations through token-aware contrastive learning to produce more discriminative and isotropic embeddings; (2) Cross-Layer Multi-Scale Aggregator, employing hierarchical aggregation of Transformer outputs via convolutional operations and gated MLPs to capture both local and global semantic patterns across layers; and (3) Blockwise Multi-Modal Coupler that decomposes URL-IP features into localized block units and computes cross-modal attention weights at the block level, enabling fine-grained inter-modal interaction. This architecture enables simultaneous preservation of fine-grained lexical cues, contextual semantics, and integration of network-level signals. Our evaluation on large-scale real-world datasets shows the framework significantly outperforms state-of-the-art baselines across binary and multi-class classification tasks.
- Abstract(参考訳): 悪意のあるURL検出は依然として重要なサイバーセキュリティ上の課題であり、敵は難読化、文字レベルの摂動、敵の攻撃といった高度な回避手法をますます採用している。
BERTのような事前学習言語モデル(PLM)は、URL分析タスクの可能性を示しているが、(1)URLの非自然な階層構造を効果的にモデル化できないこと、(2)文字レベルの難読化に対する感度が不十分であること、(3)IPアドレスのような補助的なネットワークレベルの信号を統合するメカニズムが欠如していること、の3つの制限が現在の実装で継続されている。
これらの課題に対処するために,(1)トークン対応のコントラスト学習によるサブワードトークン表現を強化し,より差別的で等方的な埋め込みを実現するToken-Contrastive Representation Enhancer,(2)階層型マルチスケールアグリゲータ,(2)畳み込み操作によるトランスフォーマー出力の階層的集約,(3)局所的およびグローバルなセマンティックパターンの両方をキャプチャするゲート型マルチモーダルカプラ,(3)URL-IP機能を局所的ブロック単位に分解し,ブロックレベルでのクロスモーダルな注目度を計算する,という3つの重要なイノベーションを取り入れた,高度なマルチモーダル検出フレームワークCURL-IPを提案する。
このアーキテクチャは、微細な語彙キュー、文脈意味論、およびネットワークレベルの信号の統合の同時保存を可能にする。
大規模実世界のデータセットに対する我々の評価は、このフレームワークがバイナリとマルチクラスの分類タスクで最先端のベースラインを大幅に上回っていることを示している。
関連論文リスト
- URL2Graph++: Unified Semantic-Structural-Character Learning for Malicious URL Detection [11.415725075802344]
悪意のあるURL検出は、サイバーセキュリティにおいて依然として大きな課題である。
マルチグラニュラリティグラフ学習とセマンティック埋め込みを組み合わせた新しい悪意のあるURL検出手法を提案する。
その結果,提案手法は大規模言語モデルを含むSOTA性能を上回ることがわかった。
論文 参考訳(メタデータ) (2025-09-12T14:27:04Z) - MIETT: Multi-Instance Encrypted Traffic Transformer for Encrypted Traffic Classification [59.96233305733875]
トラフィックの分類は、セキュリティの脅威を検出し、ネットワーク管理を最適化するために不可欠である。
トークンレベルとパケットレベルの両方の関係をキャプチャするMulti-Instance Encrypted Traffic Transformer (MIETT)を提案する。
MIETTは5つのデータセットにまたがって結果を達成し、暗号化されたトラフィックの分類と複雑なネットワーク動作の理解の有効性を示す。
論文 参考訳(メタデータ) (2024-12-19T12:52:53Z) - EAGER: Two-Stream Generative Recommender with Behavior-Semantic Collaboration [63.112790050749695]
本稿では,行動情報と意味情報の両方をシームレスに統合する新しい生成推薦フレームワークであるEAGERを紹介する。
EAGERの有効性を4つの公開ベンチマークで検証し,既存手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-20T06:21:56Z) - Multimodal Collaboration Networks for Geospatial Vehicle Detection in Dense, Occluded, and Large-Scale Events [29.86323896541765]
大規模災害では, 災害現場の物体検出能力に頼って, 最適な救助経路の計画を立てる。
既存の手法は、通常RGBのモダリティに基づいており、混み合った環境で同じ色やテクスチャでターゲットを区別するのに苦労している。
密集・隠蔽車検出のためのマルチモーダル協調ネットワーク MuDet を提案する。
論文 参考訳(メタデータ) (2024-05-14T00:51:15Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Hierarchical Disentanglement-Alignment Network for Robust SAR Vehicle
Recognition [18.38295403066007]
HDANetは機能障害とアライメントを統合フレームワークに統合する。
提案手法は,MSTARデータセットにおいて,9つの動作条件にまたがる顕著なロバスト性を示す。
論文 参考訳(メタデータ) (2023-04-07T09:11:29Z) - Transformer Based Multi-Grained Features for Unsupervised Person
Re-Identification [9.874360118638918]
視覚変換器(ViT)を改良したデュアルブランチネットワークアーキテクチャを構築した。
各ブランチで出力されるローカルトークンをリフォームし、その後一様に複数のストライプに分割して、部分レベルの特徴を生成する。
2つのブランチのグローバルトークンは、グローバル機能を生成するために平均化されます。
論文 参考訳(メタデータ) (2022-11-22T13:51:17Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。