論文の概要: MalRAG: A Retrieval-Augmented LLM Framework for Open-set Malicious Traffic Identification
- arxiv url: http://arxiv.org/abs/2511.14129v1
- Date: Tue, 18 Nov 2025 04:25:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.932362
- Title: MalRAG: A Retrieval-Augmented LLM Framework for Open-set Malicious Traffic Identification
- Title(参考訳): MalRAG: オープンセット悪意的トラフィック識別のための検索拡張LDMフレームワーク
- Authors: Xiang Luo, Chang Liu, Gang Xiong, Chen Yang, Gaopeng Gou, Yaochen Ren, Zhen Li,
- Abstract要約: MalRAGは、オープンセットの悪意のあるトラフィック識別のための検索強化フレームワークである。
コンテンツ, 構造, 時間的視点から, 悪意のあるトラフィックをマイニングすることで, マルチビュートラフィックデータベースを構築する。
我々は、トラフィック認識類似度スコアに基づいて、これらの候補の可変サブセットを選択するために、トラフィック認識適応プルーニングを用いる。
- 参考スコア(独自算出の注目度): 15.302665374408553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained identification of IDS-flagged suspicious traffic is crucial in cybersecurity. In practice, cyber threats evolve continuously, making the discovery of novel malicious traffic a critical necessity as well as the identification of known classes. Recent studies have advanced this goal with deep models, but they often rely on task-specific architectures that limit transferability and require per-dataset tuning. In this paper we introduce MalRAG, the first LLM driven retrieval-augmented framework for open-set malicious traffic identification. MalRAG freezes the LLM and operates via comprehensive traffic knowledge construction, adaptive retrieval, and prompt engineering. Concretely, we construct a multi-view traffic database by mining prior malicious traffic from content, structural, and temporal perspectives. Furthermore, we introduce a Coverage-Enhanced Retrieval Algorithm that queries across these views to assemble the most probable candidates, thereby improving the inclusion of correct evidence. We then employ Traffic-Aware Adaptive Pruning to select a variable subset of these candidates based on traffic-aware similarity scores, suppressing incorrect matches and yielding reliable retrieved evidence. Moreover, we develop a suite of guidance prompts where task instruction, evidence referencing, and decision guidance are integrated with the retrieved evidence to improve LLM performance. Across diverse real-world datasets and settings, MalRAG delivers state-of-the-art results in both fine-grained identification of known classes and novel malicious traffic discovery. Ablation and deep-dive analyses further show that MalRAG effective leverages LLM capabilities yet achieves open-set malicious traffic identification without relying on a specific LLM.
- Abstract(参考訳): IDSによる不審なトラフィックのきめ細かい識別は、サイバーセキュリティにとって不可欠だ。
実際には、サイバー脅威は継続的に進化し、新しい悪意のあるトラフィックの発見が重要であり、既知のクラスの識別も必要となる。
近年の研究では、この目標を深層モデルで進めているが、トランスファービリティを制限し、データセットごとのチューニングを必要とするタスク固有のアーキテクチャに依存していることが多い。
本稿では,最初のLLM駆動型検索拡張フレームワークであるMalRAGについて紹介する。
MalRAG は LLM を凍結し、総合的な交通知識の構築、適応検索、迅速なエンジニアリングを通じて運用する。
具体的には、コンテンツ、構造、時間的視点から悪意のあるトラフィックをマイニングすることで、マルチビュートラフィックデータベースを構築する。
さらに,これらのビューを網羅した検索アルゴリズムを導入し,最も可能性の高い候補を抽出し,正確な証拠の取り込みを改善する。
次に、トラフィック認識適応プルーニングを用いて、トラフィック認識類似度スコアに基づいて、これらの候補の可変サブセットを選択し、不正な一致を抑え、信頼できる証拠を得る。
さらに,LLM性能を向上させるために,課題指示,証拠参照,決定指導を抽出した証拠と統合する一連の指導手順を開発する。
MalRAGは、さまざまな現実世界のデータセットと設定にわたって、既知のクラスのきめ細かい識別と、新しい悪意のあるトラフィック発見の両面で、最先端の結果を提供する。
アブレーションとディープダイブ分析により、MalRAGはLLM機能を効果的に活用するが、特定のLLMに依存することなく、オープンセットの悪意のあるトラフィック識別を実現することが示された。
関連論文リスト
- Traffic-MLLM: A Spatio-Temporal MLLM with Retrieval-Augmented Generation for Causal Inference in Traffic [8.754321713184483]
本稿では,詳細なトラフィック解析に適した多モーダル大規模言語モデルであるTraffic-LMを提案する。
我々のモデルは、高品質な交通特化マルチモーダルデータセットを活用し、軽量な微調整にLowRanktemporal Adaptation (LoRA) を用いる。
また、検索ロッドジェネレーション(LoRAG)による最先端推論を融合した革新的な知識モジュールも導入する。
論文 参考訳(メタデータ) (2025-09-14T08:53:06Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - Large Language Models powered Malicious Traffic Detection: Architecture, Opportunities and Case Study [12.381768120279771]
大規模言語モデル(LLM)は膨大なテキストコーパスで訓練される。
悪意のあるトラフィック検出においてLLMの潜在能力を最大限に活用することに注力する。
本稿では,LLMを用いたDDoS検出の設計を事例として紹介する。
論文 参考訳(メタデータ) (2025-03-24T09:40:46Z) - How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文 参考訳(メタデータ) (2025-03-20T19:52:30Z) - Strada-LLM: Graph LLM for traffic prediction [62.2015839597764]
交通予測における大きな課題は、非常に異なる交通条件によって引き起こされる多様なデータ分散を扱うことである。
近位交通情報を考慮した交通予測のためのグラフ対応LLMを提案する。
我々は、新しいデータ分散に直面する際に、ドメイン適応を効率的にするための軽量なアプローチを採用する。
論文 参考訳(メタデータ) (2024-10-28T09:19:29Z) - Beyond Binary: Towards Fine-Grained LLM-Generated Text Detection via Role Recognition and Involvement Measurement [51.601916604301685]
大規模言語モデル(LLM)は、オンライン談話における信頼を損なう可能性のあるコンテンツを生成する。
現在の手法はバイナリ分類に重点を置いており、人間とLLMのコラボレーションのような現実のシナリオの複雑さに対処できないことが多い。
バイナリ分類を超えてこれらの課題に対処するために,LLM生成コンテンツを検出するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2024-10-18T08:14:10Z) - Exploring Automatic Cryptographic API Misuse Detection in the Era of LLMs [60.32717556756674]
本稿では,暗号誤用の検出において,大規模言語モデルを評価するための体系的評価フレームワークを提案する。
11,940個のLCM生成レポートを詳細に分析したところ、LSMに固有の不安定性は、報告の半数以上が偽陽性になる可能性があることがわかった。
最適化されたアプローチは、従来の手法を超え、確立されたベンチマークでこれまで知られていなかった誤用を明らかにすることで、90%近い顕著な検出率を達成する。
論文 参考訳(メタデータ) (2024-07-23T15:31:26Z) - LLMLight: Large Language Models as Traffic Signal Control Agents [25.438040499152745]
交通信号制御(TSC)は都市交通管理において重要な要素であり、道路網の効率を最適化し渋滞を軽減することを目的としている。
本稿では,大規模言語モデル (LLM) を用いた新しいフレームワーク LLMLight について述べる。
論文 参考訳(メタデータ) (2023-12-26T13:17:06Z) - Machine Learning for Encrypted Malicious Traffic Detection: Approaches,
Datasets and Comparative Study [6.267890584151111]
新型コロナウイルス(COVID-19)後の環境では、悪意のあるトラフィック暗号化が急速に増加している。
我々は、機械学習に基づく暗号化された悪意のあるトラフィック検出手法の普遍的な枠組みを定式化する。
暗号化された悪意のあるトラフィック検出アルゴリズムを10個実装し比較する。
論文 参考訳(メタデータ) (2022-03-17T14:00:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。