論文の概要: Data Augmentation for Opcode Sequence Based Malware Detection
- arxiv url: http://arxiv.org/abs/2106.11821v1
- Date: Tue, 22 Jun 2021 14:36:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 19:58:28.742066
- Title: Data Augmentation for Opcode Sequence Based Malware Detection
- Title(参考訳): opcodeシークエンスに基づくマルウェア検出のためのデータ拡張
- Authors: Niall McLaughlin, Jesus Martinez del Rincon
- Abstract要約: 固定変換を用いた基本手法からデータ拡張の異なる手法について検討し、データに適応する手法に移行する。
ネットワーク内のOpcode埋め込み層とそれに対応するOpcode埋め込み行列を用いた新しいデータ拡張手法を提案する。
我々の知る限りでは、オプコードシーケンスに基づくマルウェア分類に適用される様々な拡張手法を体系的に研究する最初の論文である。
- 参考スコア(独自算出の注目度): 2.335152769484957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data augmentation has been successfully used in many areas of deep-learning
to significantly improve model performance. Typically data augmentation
simulates realistic variations in data in order to increase the apparent
diversity of the training-set. However, for opcode-based malware analysis,
where deep learning methods are already achieving state of the art performance,
it is not immediately clear how to apply data augmentation. In this paper we
study different methods of data augmentation starting with basic methods using
fixed transformations and moving to methods that adapt to the data. We propose
a novel data augmentation method based on using an opcode embedding layer
within the network and its corresponding opcode embedding matrix to perform
adaptive data augmentation during training. To the best of our knowledge this
is the first paper to carry out a systematic study of different augmentation
methods applied to opcode sequence based malware classification.
- Abstract(参考訳): データ拡張はディープラーニングの多くの領域でうまく使われ、モデルのパフォーマンスが大幅に向上している。
通常、データ拡張はトレーニングセットの明らかな多様性を高めるために、データの現実的なバリエーションをシミュレートする。
しかし、ディープラーニング手法がすでに技術パフォーマンスの状態を達成しているOpcodeベースのマルウェア分析では、データ拡張の適用方法がすぐには明らかではない。
本稿では,固定変換を用いた基本手法からデータに適応する手法に移行することで,データ拡張の異なる手法について検討する。
本稿では,ネットワーク内のオプコード埋め込み層とそれに対応するオプコード埋め込み行列を用いて,トレーニング中に適応的データ拡張を行う新しいデータ拡張手法を提案する。
我々の知る限りでは、オプコードシーケンスに基づくマルウェア分類に適用される様々な拡張手法を体系的に研究する最初の論文である。
関連論文リスト
- Augmenting Radio Signals with Wavelet Transform for Deep Learning-Based
Modulation Recognition [6.793444383222236]
近年,無線変調認識のための深層学習が普及している。
現実のシナリオでは、事前に十分なトレーニングデータを収集することは不可能かもしれない。
データ拡張は、トレーニングデータセットの多様性と量を増やすために使用される方法である。
論文 参考訳(メタデータ) (2023-11-07T06:55:39Z) - Incorporating Supervised Domain Generalization into Data Augmentation [4.14360329494344]
本稿では,データ拡張の堅牢性と訓練効率を向上させるために,コントラッシブ・セマンティック・アライメント(CSA)ロス法を提案する。
CIFAR-100とCUBデータセットの実験により、提案手法は典型的なデータ拡張の堅牢性とトレーニング効率を向上させることが示された。
論文 参考訳(メタデータ) (2023-10-02T09:20:12Z) - Exploring Representation-Level Augmentation for Code Search [50.94201167562845]
我々は、データ処理やトレーニングを必要としない表現レベルでデータ(コードとクエリの両方)を増強する拡張手法について検討する。
大規模公開データセット上で,最先端のコード検索モデルを用いた表現レベル向上手法を実験的に評価した。
論文 参考訳(メタデータ) (2022-10-21T22:47:37Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Data Augmentation Strategies for Improving Sequential Recommender
Systems [7.986899327513767]
逐次リコメンデータシステムは近年,深層学習(DL)に基づく手法の活用により,大幅な性能向上を実現している。
本稿では,データ拡張戦略のセットを提案する。これらすべては,元の項目列を直接汚職の方法で変換するものである。
最新のDLベースのモデルの実験では、データ拡張の適用がモデルをより一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-26T09:58:14Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z) - Adaptive Weighting Scheme for Automatic Time-Series Data Augmentation [79.47771259100674]
データ拡張のための2つのサンプル適応自動重み付けスキームを提案する。
提案手法を大規模でノイズの多い財務データセットとUCRアーカイブからの時系列データセット上で検証する。
金融データセットでは、取引戦略と組み合わせた手法が50 $%$以上の年間収益の改善につながることを示し、時系列データでは、データセットの半分以上で最新モデルを上回るパフォーマンスを発揮し、他のものと同様の精度を達成しています。
論文 参考訳(メタデータ) (2021-02-16T17:50:51Z) - Generalization in Reinforcement Learning by Soft Data Augmentation [11.752595047069505]
SODA(Soft Data Augmentation)は、政策学習からAugmentationを分離する手法である。
我々は、最先端のビジョンベースRL法によるトレーニングにおいて、サンプル効率、一般化、安定性を著しく向上するSODAを見出した。
論文 参考訳(メタデータ) (2020-11-26T17:00:34Z) - Automatic Data Augmentation via Deep Reinforcement Learning for
Effective Kidney Tumor Segmentation [57.78765460295249]
医用画像セグメンテーションのための新しい学習ベースデータ拡張法を開発した。
本手法では,データ拡張モジュールと後続のセグメンテーションモジュールをエンドツーエンドのトレーニング方法で一貫した損失と,革新的に組み合わせる。
提案法の有効性を検証したCT腎腫瘍分節法について,本法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-02-22T14:10:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。