論文の概要: Scalable APT Malware Classification via Parallel Feature Extraction and GPU-Accelerated Learning
- arxiv url: http://arxiv.org/abs/2504.15497v1
- Date: Tue, 22 Apr 2025 00:05:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-01 00:54:05.305078
- Title: Scalable APT Malware Classification via Parallel Feature Extraction and GPU-Accelerated Learning
- Title(参考訳): 並列特徴抽出とGPU高速化学習によるスケーラブルAPTマルウェア分類
- Authors: Noah Subedar, Taeui Kim, Saathwick Venkataramalingam,
- Abstract要約: 本稿では、悪意のある実行可能ファイルを既知のAPT(Persistent Advanced Threat)グループにマッピングするためのフレームワークを提案する。
この分析の主な特徴は、オプコードとしても知られる実行可能ファイルに存在するアセンブリレベルの命令である。
従来のディープラーニングモデルは、マルウェアサンプルを分類できるモデルを作成するために適用される。
- 参考スコア(独自算出の注目度): 0.3277163122167433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an underlying framework for both automating and accelerating malware classification, more specifically, mapping malicious executables to known Advanced Persistent Threat (APT) groups. The main feature of this analysis is the assembly-level instructions present in executables which are also known as opcodes. The collection of such opcodes on many malicious samples is a lengthy process; hence, open-source reverse engineering tools are used in tandem with scripts that leverage parallel computing to analyze multiple files at once. Traditional and deep learning models are applied to create models capable of classifying malware samples. One-gram and two-gram datasets are constructed and used to train models such as SVM, KNN, and Decision Tree; however, they struggle to provide adequate results without relying on metadata to support n-gram sequences. The computational limitations of such models are overcome with convolutional neural networks (CNNs) and heavily accelerated using graphical compute unit (GPU) resources.
- Abstract(参考訳): 本稿では,マルウェア分類の自動化と高速化を両立させる基盤となるフレームワークについて述べる。
この分析の主な特徴は、オプコードとしても知られる実行可能ファイルに存在するアセンブリレベルの命令である。
そのため、オープンソースのリバースエンジニアリングツールは、並列コンピューティングを利用して複数のファイルを一度に解析するスクリプトと組み合わせて使用される。
従来のディープラーニングモデルは、マルウェアサンプルを分類できるモデルを作成するために適用される。
1グラムと2グラムのデータセットは、SVM、KNN、Decision Treeなどのモデルをトレーニングするために構築され、使用されているが、nグラムシーケンスをサポートするメタデータに頼ることなく適切な結果を提供するのに苦労している。
このようなモデルの計算制限は畳み込みニューラルネットワーク(CNN)で克服され、グラフィカル・コンピュート・ユニット(GPU)リソースを使用して大幅に加速される。
関連論文リスト
- Reviving Any-Subset Autoregressive Models with Principled Parallel Sampling and Speculative Decoding [55.2480439325792]
任意の順序言語モデルでは、正しい関節分布からトークンを並列にサンプリングする方法がオープンな問題である。
我々は,任意のサブセット自動回帰モデル (AS-ARM) という,異なるモデルのクラスが解を持っていることを発見した。
我々は,AS-ARMがベンチマークタスクを埋め込んだ200M未満のパラメータモデル間で最先端の性能を実現し,コード生成における50倍のモデルの性能とほぼ一致していることを示す。
論文 参考訳(メタデータ) (2025-04-29T06:33:13Z) - OpCode-Based Malware Classification Using Machine Learning and Deep Learning Techniques [0.0]
本報告では,OpCodeシークエンスを用いたマルウェア分類の包括的解析を行う。
Support Vector Machine(SVM)を用いたn-gram解析を用いた従来の機械学習、K-Nearest Neighbors(KNN)、Decision Tree分類器、畳み込みニューラルネットワーク(CNN)を用いたディープラーニングアプローチの2つのアプローチが評価されている。
論文 参考訳(メタデータ) (2025-04-18T02:09:57Z) - RGCVAE: Relational Graph Conditioned Variational Autoencoder for
Molecule Design [70.59828655929194]
ディープグラフ変分自動エンコーダは、この問題に対処可能な、最も強力な機械学習ツールの1つである。
i)新しい強力なグラフ同型ネットワークを利用した符号化ネットワーク,(ii)新しい確率的復号化コンポーネントを提案する。
論文 参考訳(メタデータ) (2023-05-19T14:23:48Z) - SWARM Parallelism: Training Large Models Can Be Surprisingly
Communication-Efficient [69.61083127540776]
ディープラーニングアプリケーションは、数十億のパラメータを持つ大きなモデルを使用することの恩恵を受ける。
これらのモデルのトレーニングは、特殊なHPCクラスタを必要とするため、非常に高価である。
安価な"プリエンプティブル"インスタンスを使用するか、あるいは複数のリージョンから既存のリソースをプールする。
論文 参考訳(メタデータ) (2023-01-27T18:55:19Z) - Quo Vadis: Hybrid Machine Learning Meta-Model based on Contextual and Behavioral Malware Representations [5.439020425819001]
複数のディープラーニングモデルを同時に利用するハイブリッド機械学習アーキテクチャを提案する。
我々は,現在の最先端モデルの能力よりも優れた検出率を報告した。
論文 参考訳(メタデータ) (2022-08-20T05:30:16Z) - Benchmark Assessment for DeepSpeed Optimization Library [1.7839986996686321]
ディープラーニング(DL)モデルは、そのパフォーマンスと大規模なデータセットを扱う能力のために、機械学習で広く使用されている。
このようなデータセットのサイズとDLモデルの複雑さは、そのようなモデルが複雑になり、大量のリソースとトレーニング時間を消費する。
最近のライブラリやアプリケーションは、DLの複雑さと効率の問題に対処するために導入されている。
論文 参考訳(メタデータ) (2022-02-12T04:52:28Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - CREPO: An Open Repository to Benchmark Credal Network Algorithms [78.79752265884109]
クレダルネットワークは、確率質量関数の集合であるクレダルに基づく不正確な確率的グラフィカルモデルである。
CREMAと呼ばれるJavaライブラリが最近リリースされ、クレダルネットワークをモデル化し、処理し、クエリする。
我々は,これらのモデル上での推論タスクの正確な結果とともに,合成クレダルネットワークのオープンリポジトリであるcrrepoを提案する。
論文 参考訳(メタデータ) (2021-05-10T07:31:59Z) - CNN vs ELM for Image-Based Malware Classification [3.4806267677524896]
マルウェア分類のための機械学習モデルを、分解やコードの実行なしに得られる特徴に基づいてトレーニングし、評価します。
ELMはCNNと同等の精度を達成できますが、ELMトレーニングは同等のCNNのトレーニングに必要な時間の2%未満を必要とします。
論文 参考訳(メタデータ) (2021-03-24T00:51:06Z) - MetaDistiller: Network Self-Boosting via Meta-Learned Top-Down
Distillation [153.56211546576978]
本研究では,ラベル生成器を用いて高い適合性を有するソフトターゲットを生成することを提案する。
このラベルジェネレータを最適化するためにメタ学習技術を用いることができる。
実験は CIFAR-100 と ILSVRC2012 の2つの標準分類ベンチマークで実施された。
論文 参考訳(メタデータ) (2020-08-27T13:04:27Z) - Analyzing Knowledge Graph Embedding Methods from a Multi-Embedding
Interaction Perspective [3.718476964451589]
実世界の知識グラフは通常不完全であるため、この問題に対処するために知識グラフ埋め込み法が提案されている。
これらの方法は、実体と関係を意味空間に埋め込まれたベクトルとして表現し、それらの間のリンクを予測する。
四元数代数に基づく新しいマルチエンベディングモデルを提案し、人気のあるベンチマークを用いて有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2019-03-27T13:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。