論文の概要: MaLAware: Automating the Comprehension of Malicious Software Behaviours using Large Language Models (LLMs)
- arxiv url: http://arxiv.org/abs/2504.01145v1
- Date: Tue, 01 Apr 2025 19:27:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:17:36.620605
- Title: MaLAware: Automating the Comprehension of Malicious Software Behaviours using Large Language Models (LLMs)
- Title(参考訳): MaLAware: 大規模言語モデル(LLM)を用いた悪意あるソフトウェア行動の理解の自動化
- Authors: Bikash Saha, Nanda Rani, Sandeep Kumar Shukla,
- Abstract要約: MaLAwareは、生のマルウェアデータを人間可読な記述に変換するツールである。
MALAwareは、Cuckoo Sandboxの生成したレポートを処理し、悪性度を相関させ、簡潔な要約を生成する。
評価では,人間によるマルウェアの行動記述データセットを基礎的真理として用いた。
- 参考スコア(独自算出の注目度): 3.410195565199523
- License:
- Abstract: Current malware (malicious software) analysis tools focus on detection and family classification but fail to provide clear and actionable narrative insights into the malignant activity of the malware. Therefore, there is a need for a tool that translates raw malware data into human-readable descriptions. Developing such a tool accelerates incident response, reduces malware analysts' cognitive load, and enables individuals having limited technical expertise to understand malicious software behaviour. With this objective, we present MaLAware, which automatically summarizes the full spectrum of malicious activity of malware executables. MaLAware processes Cuckoo Sandbox-generated reports using large language models (LLMs) to correlate malignant activities and generate concise summaries explaining malware behaviour. We evaluate the tool's performance on five open-source LLMs. The evaluation uses the human-written malware behaviour description dataset as ground truth. The model's performance is measured using 11 extensive performance metrics, which boosts the confidence of MaLAware's effectiveness. The current version of the tool, i.e., MaLAware, supports Qwen2.5-7B, Llama2-7B, Llama3.1-8B, Mistral-7B, and Falcon-7B, along with the quantization feature for resource-constrained environments. MaLAware lays a foundation for future research in malware behavior explanation, and its extensive evaluation demonstrates LLMs' ability to narrate malware behavior in an actionable and comprehensive manner.
- Abstract(参考訳): 現在のマルウェア(マルウェアソフトウェア)分析ツールは、検出と家族分類に重点を置いているが、マルウェアの悪性活動に関する明確で実用的な物語的な洞察を与えていない。
そのため、生のマルウェアデータを人間可読な記述に変換するツールが必要である。
このようなツールの開発は、インシデント対応を加速し、マルウェアアナリストの認知負荷を低減し、限られた専門知識を持つ個人が悪意のあるソフトウェア動作を理解することを可能にする。
そこで本研究では,マルウェア実行環境における悪意ある活動の全範囲を自動で要約するMALAwareを提案する。
MaLAwareは、大きな言語モデル(LLM)を使用してCuckoo Sandboxが生成したレポートを処理し、悪性度を相関させ、マルウェアの振る舞いを説明する簡潔な要約を生成する。
ツールの性能を5つのオープンソースLCMで評価する。
評価では,人間によるマルウェアの行動記述データセットを基礎的真理として用いた。
モデルのパフォーマンスは、11の広範なパフォーマンスメトリクスを使用して測定されるため、MALAwareの有効性の信頼性が向上する。
現在のバージョンのMaLAwareはQwen2.5-7B、Llama2-7B、Llama3.1-8B、Mistral-7B、Falcon-7Bをサポートする。
MaLAwareは、マルウェアの振る舞いの説明に関する将来の研究の基礎を築き、その広範な評価は、LLMがマルウェアの振る舞いを行動可能で包括的な方法で物語る能力を示している。
関連論文リスト
- Unveiling Malware Patterns: A Self-analysis Perspective [15.517313565392852]
VisUnpackは静的解析ベースのデータ可視化フレームワークで、攻撃防止と攻撃後の回復を支援する。
本手法は,パッケージ化されたマルウェアプログラムのアンパック化,基本ブロックに基づく局所的類似性記述子の計算,ディスクリプタ間の相関性の向上,ノイズの最小化による修正を含む。
27,106以上のサンプルを収集したデータセットに基づくVisUnpackの包括的評価では、99.7%の精度でマルウェアプログラムを正確に分類する能力が確認されている。
論文 参考訳(メタデータ) (2025-01-10T16:04:13Z) - Exploring Large Language Models for Semantic Analysis and Categorization of Android Malware [0.0]
mspは、階層的な階層化チェーンと戦略的プロンプトエンジニアリングを通じて、Androidのマルウェア分析を強化するように設計されている。
mspは、関数、クラス、パッケージレベルで非常に堅牢な要約を提供しながら、最大77%の分類精度を達成することができる。
論文 参考訳(メタデータ) (2025-01-08T21:22:45Z) - MASKDROID: Robust Android Malware Detection with Masked Graph Representations [56.09270390096083]
マルウェアを識別する強力な識別能力を持つ強力な検出器MASKDROIDを提案する。
我々は、グラフニューラルネットワークベースのフレームワークにマスキング機構を導入し、MASKDROIDに入力グラフ全体の復元を強制する。
この戦略により、モデルは悪意のあるセマンティクスを理解し、より安定した表現を学習し、敵攻撃に対する堅牢性を高めることができる。
論文 参考訳(メタデータ) (2024-09-29T07:22:47Z) - Learning to Ask: When LLM Agents Meet Unclear Instruction [55.65312637965779]
大きな言語モデル(LLM)は、言語スキルだけでは達成不可能なタスクに対処するための外部ツールを活用することができる。
我々は、不完全な命令下でのLLMツールの使用性能を評価し、エラーパターンを分析し、Noisy ToolBenchと呼ばれる挑戦的なツール使用ベンチマークを構築した。
Ask-when-Needed (AwN) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-31T23:06:12Z) - Catch'em all: Classification of Rare, Prominent, and Novel Malware Families [3.147175286021779]
マルウェアは依然として最も危険でコストのかかるサイバー脅威の1つだ。
昨年、13億の既知のマルウェアの標本が報告された。
これらの課題には、新しいマルウェアの検出と、クラス不均衡に直面してマルウェア分類を実行する能力が含まれる。
論文 参考訳(メタデータ) (2024-03-04T23:46:19Z) - MalDICT: Benchmark Datasets on Malware Behaviors, Platforms, Exploitation, and Packers [44.700094741798445]
マルウェア分類に関する既存の研究は、悪意のあるファイルと良性のあるファイルの区別と、家族によるマルウェアの分類という2つのタスクにのみ焦点をあてている。
我々は、マルウェアが提示する行動の分類、マルウェアが実行しているプラットフォーム、マルウェアが悪用する脆弱性、マルウェアが詰め込まれているパッカーの4つのタスクを特定した。
ClarAVyを使ってタグ付けされ、合計で550万近い悪意のあるファイルで構成されています。
論文 参考訳(メタデータ) (2023-10-18T04:36:26Z) - DRSM: De-Randomized Smoothing on Malware Classifier Providing Certified
Robustness [58.23214712926585]
我々は,マルウェア検出領域の非ランダム化スムース化技術を再設計し,DRSM(De-Randomized Smoothed MalConv)を開発した。
具体的には,実行可能ファイルの局所構造を最大に保ちながら,逆数バイトの影響を確実に抑制するウィンドウアブレーション方式を提案する。
私たちは、マルウェア実行ファイルの静的検出という領域で、認証された堅牢性を提供する最初の人です。
論文 参考訳(メタデータ) (2023-03-20T17:25:22Z) - Mate! Are You Really Aware? An Explainability-Guided Testing Framework
for Robustness of Malware Detectors [49.34155921877441]
マルウェア検出装置のロバスト性を示すための説明可能性誘導型およびモデルに依存しないテストフレームワークを提案する。
次に、このフレームワークを使用して、操作されたマルウェアを検出する最先端のマルウェア検知器の能力をテストする。
我々の発見は、現在のマルウェア検知器の限界と、その改善方法に光を当てた。
論文 参考訳(メタデータ) (2021-11-19T08:02:38Z) - A Novel Malware Detection Mechanism based on Features Extracted from
Converted Malware Binary Images [0.22843885788439805]
マルウェアのバイナリイメージを使用して、異なる特徴を抽出し、得られたデータセットに異なるML分類器を用いる。
本手法は,抽出した特徴に基づくマルウェアの分類に成功していることを示す。
論文 参考訳(メタデータ) (2021-04-14T06:55:52Z) - Being Single Has Benefits. Instance Poisoning to Deceive Malware
Classifiers [47.828297621738265]
攻撃者は、マルウェア分類器を訓練するために使用されるデータセットをターゲットとした、高度で効率的な中毒攻撃を、どのように起動できるかを示す。
マルウェア検出領域における他の中毒攻撃とは対照的に、我々の攻撃はマルウェアファミリーではなく、移植されたトリガーを含む特定のマルウェアインスタンスに焦点を当てている。
我々は、この新たに発見された深刻な脅威に対する将来の高度な防御に役立つ包括的検出手法を提案する。
論文 参考訳(メタデータ) (2020-10-30T15:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。