論文の概要: BEACON: Behavioral Malware Classification with Large Language Model Embeddings and Deep Learning
- arxiv url: http://arxiv.org/abs/2509.14519v1
- Date: Thu, 18 Sep 2025 01:24:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.017863
- Title: BEACON: Behavioral Malware Classification with Large Language Model Embeddings and Deep Learning
- Title(参考訳): BEACON: 大規模言語モデル埋め込みとディープラーニングによる行動的マルウェア分類
- Authors: Wadduwage Shanika Perera, Haodi Jiang,
- Abstract要約: 従来の静的解析は、コードの難読化、ポリモーフィズム、その他の回避技術を用いた現代の脅威に対して防御に失敗する。
本研究では,大規模言語モデル(LLM)を利用した新しいディープラーニングフレームワークBEACONを提案する。
これらの埋め込みは、各サンプルのセマンティックおよび構造パターンをキャプチャし、マルチクラスのマルウェア分類のための1次元畳み込みニューラルネットワーク(1D CNN)によって処理される。
- 参考スコア(独自算出の注目度): 0.21485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Malware is becoming increasingly complex and widespread, making it essential to develop more effective and timely detection methods. Traditional static analysis often fails to defend against modern threats that employ code obfuscation, polymorphism, and other evasion techniques. In contrast, behavioral malware detection, which monitors runtime activities, provides a more reliable and context-aware solution. In this work, we propose BEACON, a novel deep learning framework that leverages large language models (LLMs) to generate dense, contextual embeddings from raw sandbox-generated behavior reports. These embeddings capture semantic and structural patterns of each sample and are processed by a one-dimensional convolutional neural network (1D CNN) for multi-class malware classification. Evaluated on the Avast-CTU Public CAPE Dataset, our framework consistently outperforms existing methods, highlighting the effectiveness of LLM-based behavioral embeddings and the overall design of BEACON for robust malware classification.
- Abstract(参考訳): マルウェアはますます複雑で広まりつつあるため、より効果的でタイムリーな検出方法を開発することが不可欠である。
従来の静的解析は、しばしばコードの難読化、多型、その他の回避技術を用いた現代の脅威に対して防御に失敗する。
対照的に、実行時のアクティビティを監視する行動マルウェア検出は、より信頼性が高く、コンテキスト対応のソリューションを提供する。
本研究では,大規模言語モデル(LLM)を活用して,生のサンドボックス生成行動レポートから密集したコンテキスト埋め込みを生成する,新しいディープラーニングフレームワークBEACONを提案する。
これらの埋め込みは、各サンプルのセマンティックおよび構造パターンをキャプチャし、マルチクラスのマルウェア分類のための1次元畳み込みニューラルネットワーク(1D CNN)によって処理される。
Avast-CTU Public CAPEデータセットに基づいて評価し、我々のフレームワークは既存の手法を一貫して上回り、LSMベースの行動埋め込みの有効性と、堅牢なマルウェア分類のためのBEACONの全体的な設計を強調した。
関連論文リスト
- MalLoc: Toward Fine-grained Android Malicious Payload Localization via LLMs [44.97660453235412]
MalLocは、Androidマルウェアの詳細なレベルで悪意のあるペイロードをローカライズするための、新しいアプローチである。
この研究は、振る舞いレベルの悪意のあるロジックに対する深い洞察を可能にすることによって、従来の検出と分類を超えて進んでいる。
論文 参考訳(メタデータ) (2025-08-25T10:05:44Z) - A Novel Study on Intelligent Methods and Explainable AI for Dynamic Malware Analysis [0.0]
本研究は、マルウェア検出モデルの解釈可能性と信頼性を高めるために、説明可能なAI(XAI)技術を統合する。
この研究は、ディープラーニングモデルの内部動作を軽視し、サイバーセキュリティの文脈における予測能力のより良い理解と信頼を促進することを目的としている。
論文 参考訳(メタデータ) (2025-08-14T13:49:29Z) - Breaking Focus: Contextual Distraction Curse in Large Language Models [68.4534308805202]
大規模言語モデル(LLM)の重大な脆弱性について検討する。
この現象は、セマンティック・コヒーレントだが無関係な文脈で修正された質問に対して、モデルが一貫した性能を維持することができないときに発生する。
本稿では,CDVの例を自動生成する効率的な木探索手法を提案する。
論文 参考訳(メタデータ) (2025-02-03T18:43:36Z) - A Novel Approach to Malicious Code Detection Using CNN-BiLSTM and Feature Fusion [2.3039261241391586]
本研究では,マルウェアのバイナリファイルをグレースケールのイメージに変換するためにminhashアルゴリズムを用いる。
この研究は、IDA Proを用いてオペコードシーケンスをデコンパイルし、抽出し、特徴ベクトル化にN-gramとtf-idfアルゴリズムを適用した。
CNN-BiLSTM融合モデルは、画像の特徴とオプコードシーケンスを同時に処理し、分類性能を向上させるように設計されている。
論文 参考訳(メタデータ) (2024-10-12T07:10:44Z) - MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - Transfer Learning in Pre-Trained Large Language Models for Malware Detection Based on System Calls [3.5698678013121334]
本研究は,システムコールデータに基づいてマルウェアを分類するために,大規模言語モデル(LLM)を利用した新しいフレームワークを提案する。
1TBを超えるシステムコールのデータセットによる実験では、BigBirdやLongformerのようなより大きなコンテキストサイズを持つモデルの方が精度が良く、F1スコアは約0.86である。
このアプローチは、ハイテイク環境におけるリアルタイム検出の大きな可能性を示し、サイバー脅威の進化に対する堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2024-05-15T13:19:43Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of
Language Models [86.02610674750345]
AdvGLUE(Adversarial GLUE)は、様々な種類の敵攻撃の下で、現代の大規模言語モデルの脆弱性を調査し評価するための新しいマルチタスクベンチマークである。
GLUEタスクに14の逆攻撃手法を適用してAdvGLUEを構築する。
テストしたすべての言語モデルとロバストなトレーニングメソッドは、AdvGLUEではパフォーマンスが悪く、スコアは明確な精度よりもはるかに遅れています。
論文 参考訳(メタデータ) (2021-11-04T12:59:55Z) - Task-Aware Meta Learning-based Siamese Neural Network for Classifying
Obfuscated Malware [5.293553970082943]
既存のマルウェア検出方法は、トレーニングデータセットに難読化されたマルウェアサンプルが存在する場合、異なるマルウェアファミリーを正しく分類できない。
そこで我々は,このような制御フロー難読化技術に対して耐性を持つ,タスク対応の複数ショット学習型サイメスニューラルネットワークを提案する。
提案手法は,同一のマルウェアファミリーに属するマルウェアサンプルを正しく分類し,ユニークなマルウェアシグネチャの認識に極めて有効である。
論文 参考訳(メタデータ) (2021-10-26T04:44:13Z) - Mal2GCN: A Robust Malware Detection Approach Using Deep Graph
Convolutional Networks With Non-Negative Weights [1.3190581566723918]
実世界の敵に対するマルウェア検出モデルの堅牢性を評価するために,ブラックボックスのソースコードをベースとしたマルウェア生成手法を提案する。
そこで我々は,堅牢なマルウェア検出モデルであるMal2GCNを提案する。Mal2GCNは,グラフ畳み込みネットワークの表現力と非負重み学習法を組み合わせて,高い検出精度でマルウェア検出モデルを作成する。
論文 参考訳(メタデータ) (2021-08-27T19:42:13Z) - Adversarial EXEmples: A Survey and Experimental Evaluation of Practical
Attacks on Machine Learning for Windows Malware Detection [67.53296659361598]
EXEmplesは、比較的少ない入力バイトを摂動することで、機械学習に基づく検出をバイパスすることができる。
我々は、機械学習モデルに対する過去の攻撃を包含し、一般化するだけでなく、3つの新たな攻撃を含む統一フレームワークを開発する。
これらの攻撃はFull DOS、Extended、Shiftと呼ばれ、DOSヘッダをそれぞれ操作し、拡張し、第1セクションの内容を変更することで、敵のペイロードを注入する。
論文 参考訳(メタデータ) (2020-08-17T07:16:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。