論文の概要: MalVol-25: A Diverse, Labelled and Detailed Volatile Memory Dataset for Malware Detection and Response Testing and Validation
- arxiv url: http://arxiv.org/abs/2507.03993v1
- Date: Sat, 05 Jul 2025 10:45:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.963186
- Title: MalVol-25: A Diverse, Labelled and Detailed Volatile Memory Dataset for Malware Detection and Response Testing and Validation
- Title(参考訳): MalVol-25: マルウェアの検出と応答テストと検証のための多変量ラベル付き詳細な揮発性メモリデータセット
- Authors: Dipo Dunsin, Mohamed Chahine Ghanem, Eduardo Almeida Palmieri,
- Abstract要約: 既存のデータセットには、多様性、包括的なラベル付け、効果的な機械学習とエージェントAIトレーニングに必要な複雑さが欠如していることが多い。
このギャップを埋めるために、制御された仮想環境における自動マルウェア実行と動的監視ツールを組み合わせたデータセットを生成するための体系的なアプローチを開発した。
得られたデータセットは、複数のマルウェアファミリーとオペレーティングシステムにまたがるクリーンで感染したメモリスナップショットを含み、詳細な振る舞いと環境の特徴をキャプチャする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the critical need for high-quality malware datasets that support advanced analysis techniques, particularly machine learning and agentic AI frameworks. Existing datasets often lack diversity, comprehensive labelling, and the complexity necessary for effective machine learning and agent-based AI training. To fill this gap, we developed a systematic approach for generating a dataset that combines automated malware execution in controlled virtual environments with dynamic monitoring tools. The resulting dataset comprises clean and infected memory snapshots across multiple malware families and operating systems, capturing detailed behavioural and environmental features. Key design decisions include applying ethical and legal compliance, thorough validation using both automated and manual methods, and comprehensive documentation to ensure replicability and integrity. The dataset's distinctive features enable modelling system states and transitions, facilitating RL-based malware detection and response strategies. This resource is significant for advancing adaptive cybersecurity defences and digital forensic research. Its scope supports diverse malware scenarios and offers potential for broader applications in incident response and automated threat mitigation.
- Abstract(参考訳): 本稿では,高度な解析技術,特に機械学習とエージェントAIフレームワークをサポートする高品質なマルウェアデータセットの必要性に対処する。
既存のデータセットには、多様性、包括的なラベル付け、効果的な機械学習とエージェントベースのAIトレーニングに必要な複雑さが欠如していることが多い。
このギャップを埋めるために、制御された仮想環境における自動マルウェア実行と動的監視ツールを組み合わせたデータセットを生成するための体系的なアプローチを開発した。
得られたデータセットは、複数のマルウェアファミリーとオペレーティングシステムにまたがるクリーンで感染したメモリスナップショットを含み、詳細な振る舞いと環境の特徴をキャプチャする。
主な設計上の決定は、倫理的および法的コンプライアンスの適用、自動化と手動の両方の手法による徹底的な検証、レプリカ性と整合性を保証する包括的なドキュメントなどである。
データセットの特徴的な特徴は、システム状態と遷移のモデリングを可能にし、RLベースのマルウェア検出と応答戦略を容易にする。
このリソースは、適応的なサイバーセキュリティ防衛とデジタル法医学研究を進める上で重要である。
そのスコープは多様なマルウェアシナリオをサポートし、インシデント対応や自動脅威軽減における幅広いアプリケーションの可能性を提供する。
関連論文リスト
- Rethinking Data Protection in the (Generative) Artificial Intelligence Era [115.71019708491386]
現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。
当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文 参考訳(メタデータ) (2025-07-03T02:45:51Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - Predicting Vulnerability to Malware Using Machine Learning Models: A Study on Microsoft Windows Machines [0.0]
本研究では機械学習(ML)技術を活用した効果的なマルウェア検出戦略の必要性に対処する。
本研究の目的は、個々のマシンの特定の状況に基づいて、マルウェアの脆弱性を正確に予測する高度なMLモデルを開発することである。
論文 参考訳(メタデータ) (2025-01-05T10:04:58Z) - Transfer Learning in Pre-Trained Large Language Models for Malware Detection Based on System Calls [3.5698678013121334]
本研究は,システムコールデータに基づいてマルウェアを分類するために,大規模言語モデル(LLM)を利用した新しいフレームワークを提案する。
1TBを超えるシステムコールのデータセットによる実験では、BigBirdやLongformerのようなより大きなコンテキストサイズを持つモデルの方が精度が良く、F1スコアは約0.86である。
このアプローチは、ハイテイク環境におけるリアルタイム検出の大きな可能性を示し、サイバー脅威の進化に対する堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2024-05-15T13:19:43Z) - The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。
LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。
機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文 参考訳(メタデータ) (2024-03-23T09:26:15Z) - Comprehensive evaluation of Mal-API-2019 dataset by machine learning in malware detection [0.5475886285082937]
本研究では,機械学習技術を用いたマルウェア検出の徹底的な検討を行う。
その目的は、脅威をより効果的に識別し緩和することで、サイバーセキュリティの能力を向上させることである。
論文 参考訳(メタデータ) (2024-03-04T17:22:43Z) - REEF: A Framework for Collecting Real-World Vulnerabilities and Fixes [40.401211102969356]
本稿では,REal-world vulnErabilities and Fixesをオープンソースリポジトリから収集するための自動収集フレームワークREEFを提案する。
脆弱性とその修正を収集する多言語クローラを開発し、高品質な脆弱性修正ペアをフィルタするためのメトリクスを設計する。
大規模な実験を通じて,我々の手法が高品質な脆弱性修正ペアを収集し,強力な説明を得られることを示す。
論文 参考訳(メタデータ) (2023-09-15T02:50:08Z) - Realistic simulation of users for IT systems in cyber ranges [63.20765930558542]
ユーザアクティビティを生成するために,外部エージェントを用いて各マシンを計測する。
このエージェントは、決定論的および深層学習に基づく手法を組み合わせて、異なる環境に適応する。
また,会話や文書の作成を容易にする条件付きテキスト生成モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T10:53:29Z) - Dataset Security for Machine Learning: Data Poisoning, Backdoor Attacks,
and Defenses [150.64470864162556]
この作業は体系的に分類され、幅広いデータセット脆弱性とエクスプロイトを議論する。
様々な毒とバックドアの脅威モデルとそれらの関係を記述することに加えて,それらの統一分類法を展開する。
論文 参考訳(メタデータ) (2020-12-18T22:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。