論文の概要: Fine-tuning Large Language Models for DGA and DNS Exfiltration Detection
- arxiv url: http://arxiv.org/abs/2410.21723v1
- Date: Tue, 29 Oct 2024 04:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:38:40.696872
- Title: Fine-tuning Large Language Models for DGA and DNS Exfiltration Detection
- Title(参考訳): DGAおよびDNS抽出検出のための微調整大言語モデル
- Authors: Md Abu Sayed, Asif Rahman, Christopher Kiekintveld, Sebastian Garcia,
- Abstract要約: 大規模言語モデル(LLM)は、リアルタイム検出タスクにおいてその習熟度を実証している。
本研究は, DGA および DNS ろ過攻撃を検出するための微調整 LLM の有効性を検証する。
- 参考スコア(独自算出の注目度): 1.350128573715538
- License:
- Abstract: Domain Generation Algorithms (DGAs) are malicious techniques used by malware to dynamically generate seemingly random domain names for communication with Command & Control (C&C) servers. Due to the fast and simple generation of DGA domains, detection methods must be highly efficient and precise to be effective. Large Language Models (LLMs) have demonstrated their proficiency in real-time detection tasks, making them ideal candidates for detecting DGAs. Our work validates the effectiveness of fine-tuned LLMs for detecting DGAs and DNS exfiltration attacks. We developed LLM models and conducted comprehensive evaluation using a diverse dataset comprising 59 distinct real-world DGA malware families and normal domain data. Our LLM model significantly outperformed traditional natural language processing techniques, especially in detecting unknown DGAs. We also evaluated its performance on DNS exfiltration datasets, demonstrating its effectiveness in enhancing cybersecurity measures. To the best of our knowledge, this is the first work that empirically applies LLMs for DGA and DNS exfiltration detection.
- Abstract(参考訳): ドメイン生成アルゴリズム(Domain Generation Algorithms, DGA)は、C&Cサーバと通信するためにランダムなドメイン名を動的に生成するためにマルウェアが使用する悪質な手法である。
DGAドメインの高速かつ単純な生成のため、検出方法は非常に効率的で正確で有効でなければならない。
LLM(Large Language Models)は、リアルタイム検出タスクにおいてその習熟度を実証し、DGAを検出するのに理想的な候補となる。
本研究は, DGA および DNS ろ過攻撃を検出するための微調整 LLM の有効性を検証する。
我々は LLM モデルを開発し,59 種類の実世界の DGA マルウェアファミリーと通常のドメインデータからなる多様なデータセットを用いて包括的評価を行った。
LLMモデルは,特に未知のDGAの検出において,従来の自然言語処理技術よりも優れていた。
また、DNS流出データセットの性能評価を行い、サイバーセキュリティ対策の強化効果を実証した。
我々の知る限りでは、DGAとDNS消去検出にLLMを実証的に適用した最初の研究である。
関連論文リスト
- LLMs for Domain Generation Algorithm Detection [0.0]
本研究では,大規模言語モデル(LLM)を用いてドメイン生成アルゴリズム(DGA)の検出を行う。
In-Context Learning (ICL) と Supervised Fine-Tuning (SFT) はどのように検出を改善するかを示す。
特に、SFTベースのLDM DGA検出器は注目層を用いた最先端モデルよりも優れ、4%の偽陽性率(FPR)で94%の精度を実現している。
論文 参考訳(メタデータ) (2024-11-05T18:01:12Z) - Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。
Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。
DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文 参考訳(メタデータ) (2024-07-10T11:11:36Z) - DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - The Unreasonable Effectiveness of Large Language-Vision Models for
Source-free Video Domain Adaptation [56.61543110071199]
Source-Free Video Unsupervised Domain Adaptation (SFVUDA)タスクは、ラベル付きソースデータセットでトレーニングされたアクション認識モデルを、ラベル付きターゲットデータセットに適応させることによって構成される。
従来のアプローチでは、ターゲットデータ自体から派生した自己スーパービジョンを活用してSFVUDAに対処しようと試みてきた。
我々は、LLVMがドメインシフトに対して驚くほど堅牢になる前に、リッチな世界を含むという理論によって、LLVM(Large Language-Vision Models)から"web-supervision"を利用するアプローチを取る。
論文 参考訳(メタデータ) (2023-08-17T18:12:05Z) - Explaining Machine Learning DGA Detectors from DNS Traffic Data [11.049278217301048]
この研究は、ボットネットとDGA検出の文脈における説明可能なMLの問題に対処する。
ボットネット/DGA検出のために考案されたML分類器の決定を具体的に分解するのは、これが初めてである。
論文 参考訳(メタデータ) (2022-08-10T11:34:26Z) - Detecting Algorithmically Generated Domains Using a GCNN-LSTM Hybrid
Neural Network [10.617124610646488]
ドメイン生成アルゴリズム(DGA)は、ボットネットによって秘密のコマンドと制御(C&C)通信チャネルを構築するために使用される。
AGD検出アルゴリズムは、既存のDGA技術に対応する軽量で有望なソリューションを提供する。
本稿では,AGD検出のためのGCNN-LSTM (long short-term memory) Hybrid Neural Network (GLHNN)を提案する。
論文 参考訳(メタデータ) (2022-08-06T05:15:45Z) - On Certifying and Improving Generalization to Unseen Domains [87.00662852876177]
ドメインの一般化は、テスト時に遭遇した見知らぬドメインのパフォーマンスが高いモデルを学ぶことを目的としています。
いくつかのベンチマークデータセットを使用して、DGアルゴリズムを包括的に評価することは困難である。
我々は,任意のDG手法の最悪の性能を効率的に証明できる普遍的な認証フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-24T16:29:43Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - CMT in TREC-COVID Round 2: Mitigating the Generalization Gaps from Web
to Special Domain Search [89.48123965553098]
本稿では,特殊領域適応問題を緩和する探索システムを提案する。
このシステムは、ドメイン適応型事前学習と数発の学習技術を利用して、ニューラルネットワークがドメインの不一致を軽減するのに役立つ。
本システムでは,TREC-COVID タスクの第2ラウンドにおいて,非マニュアル実行において最善を尽くす。
論文 参考訳(メタデータ) (2020-11-03T09:10:48Z) - Real-Time Detection of Dictionary DGA Network Traffic using Deep
Learning [5.915780927888678]
ボットネットとマルウェアは、ドメイン生成アルゴリズム(DGA)を使用して、ユニークな動的に生成されたWebアドレスへのコールアウトを検出することを避ける。
一般的なDGA検出技術は、ランダム辞書語を組み合わせたDGA変種を確実に検出できず、正規ドメインを忠実にミラーするドメイン名を生成する。
我々は、新しいハイブリッドニューラルネットワーク、Bilbo the bagging modelを作成し、ドメインを分析し、それらがそのようなアルゴリズムによって生成される可能性を評価する。
論文 参考訳(メタデータ) (2020-03-28T14:57:22Z) - Inline Detection of DGA Domains Using Side Information [5.253305460558346]
ドメイン生成アルゴリズム(DGA)は擬似ランダムドメイン名を生成する一般的な方法である。
近年,機械学習に基づくシステムはDGAの検出に広く利用されている。
我々は、ドメイン名自体よりも敵が操作しにくいサイド情報を用いて、DGA検出のための最先端のディープラーニング・ランダム・フォレスト(RF)分類器を訓練し、評価する。
論文 参考訳(メタデータ) (2020-03-12T11:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。