論文の概要: Malware Analysis with Symbolic Execution and Graph Kernel
- arxiv url: http://arxiv.org/abs/2204.05632v1
- Date: Tue, 12 Apr 2022 08:52:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 14:37:07.606190
- Title: Malware Analysis with Symbolic Execution and Graph Kernel
- Title(参考訳): シンボル実行とグラフカーネルによるマルウェア解析
- Authors: Charles-Henry Bertrand Van Ouytsel and Axel Legay
- Abstract要約: 機械学習に基づく分類のためのオープンソースのツールチェーンを提案する。
グラフ間の局所的な類似性を捉えることができる1次元Weisfeiler-Lehmanカーネルに焦点を当てる。
- 参考スコア(独自算出の注目度): 2.1377923666134113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Malware analysis techniques are divided into static and dynamic analysis.
Both techniques can be bypassed by circumvention techniques such as
obfuscation. In a series of works, the authors have promoted the use of
symbolic executions combined with machine learning to avoid such traps. Most of
those works rely on natural graph-based representations that can then be
plugged into graph-based learning algorithms such as Gspan. There are two main
problems with this approach. The first one is in the cost of computing the
graph. Indeed, working with graphs requires one to compute and representing the
entire state-space of the file under analysis. As such computation is too
cumbersome, the techniques often rely on developing strategies to compute a
representative subgraph of the behaviors. Unfortunately, efficient
graph-building strategies remain weakly explored. The second problem is in the
classification itself. Graph-based machine learning algorithms rely on
comparing the biggest common structures. This sidelines small but specific
parts of the malware signature. In addition, it does not allow us to work with
efficient algorithms such as support vector machine. We propose a new efficient
open source toolchain for machine learning-based classification. We also
explore how graph-kernel techniques can be used in the process. We focus on the
1-dimensional Weisfeiler-Lehman kernel, which can capture local similarities
between graphs. Our experimental results show that our approach outperforms
existing ones by an impressive factor.
- Abstract(参考訳): マルウェア解析技術は静的解析と動的解析に分けられる。
どちらの手法も難読化のような回避技術によってバイパスすることができる。
著者らは一連の研究で、このようなトラップを避けるために、機械学習と組み合わせたシンボル実行の使用を奨励している。
これらのほとんどは、自然グラフベースの表現に依存しており、gspanのようなグラフベースの学習アルゴリズムにプラグインすることができる。
このアプローチには2つの大きな問題があります。
1つ目は、グラフを計算するコストです。
実際、グラフを扱うには、分析中のファイルの状態空間全体を計算して表現する必要がある。
このような計算は面倒すぎるため、その手法は行動の代表的な部分グラフを計算するための戦略の開発にしばしば依存する。
残念ながら、効率的なグラフ構築戦略はいまだに弱い。
第二の問題は分類そのものである。
グラフベースの機械学習アルゴリズムは、最大の共通構造の比較に依存する。
これはマルウェアシグネチャの小さいが特定の部分を横取りする。
また,ベクトルマシンのサポートなど,効率的なアルゴリズムの開発も不可能である。
機械学習に基づく分類のためのオープンソースのツールチェーンを提案する。
また、このプロセスでグラフカーネル技術をどのように利用できるかについても検討する。
グラフ間の局所的な類似性を捉えることができる1次元Weisfeiler-Lehmanカーネルに焦点を当てる。
実験結果から,本手法は既存手法よりも優れた性能を示した。
関連論文リスト
- Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - Learning node embeddings via summary graphs: a brief theoretical
analysis [55.25628709267215]
グラフ表現学習は多くのグラフマイニングアプリケーションにおいて重要な役割を果たすが、大規模なグラフの埋め込みを学習することは依然として問題である。
最近の研究は、グラフの要約(つまり、より小さな要約グラフへの埋め込みを学習し、元のグラフのノード埋め込みを復元することでスケーラビリティを向上させる。
本稿では,導入したカーネル行列に基づく3つの特定の埋め込み学習手法について,詳細な理論的解析を行う。
論文 参考訳(メタデータ) (2022-07-04T04:09:50Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - Computing Graph Descriptors on Edge Streams [4.129847064263056]
約3種類のグラフ記述子を計算するために,ストリーミングアルゴリズムを提案する。
エッジストリームを操作することで、グラフ全体をメモリに格納するのを避けることができます。
私たちのスケーラブルなアルゴリズムは、数分で数百万のエッジを持つグラフの記述子を計算します。
論文 参考訳(メタデータ) (2021-09-02T06:21:47Z) - Partition and Code: learning how to compress graphs [50.29024357495154]
まず、分割アルゴリズムがグラフを基本構造に分解し、これらを確率分布を学習する小さな辞書の要素にマッピングし、エントロピーエンコーダが表現をビットに変換する。
提案アルゴリズムは,非パラメトリックおよびパラメトリックグラフ圧縮器の異なるファミリーに対して,多種多様な実世界のネットワーク上で定量的に評価し,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2021-07-05T11:41:16Z) - Graph coarsening: From scientific computing to machine learning [11.728753892489776]
本研究の目的は,科学計算に成功している粗大化手法を幅広く検討することである。
機械学習では、グラフ粗化は、グラフダウンサンプリングやグラフリダクションなど、様々な名前で呼ばれる。
このように、これらの方法の一般的な戦略は、粗グラフを定義するためにスペクトル特性に依存することである。
論文 参考訳(メタデータ) (2021-06-22T15:31:50Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Understanding Coarsening for Embedding Large-Scale Graphs [3.6739949215165164]
機械学習(ML)アルゴリズムによるグラフの適切な解析は、研究や産業の多くの分野において、より深い洞察をもたらす可能性がある。
グラフデータの不規則構造は、グラフ上でMLタスクを実行するための障害を構成する。
本研究では, 粗大化品質が埋込み性能に及ぼす影響を, 速度と精度の両方で解析する。
論文 参考訳(メタデータ) (2020-09-10T15:06:33Z) - About Graph Degeneracy, Representation Learning and Scalability [2.029783382155471]
ウォークベースグラフ表現学習アルゴリズムの時間とメモリ消費を削減するために,Kコア分解を利用した2つの手法を提案する。
提案手法の有効性を,いくつかの学術的データセットを用いて評価した。
論文 参考訳(メタデータ) (2020-09-04T09:39:43Z) - Graph topology inference benchmarks for machine learning [16.857405938139525]
本稿では,グラフ推論手法の相対的メリットと限界を明らかにするために,いくつかのベンチマークを導入する。
我々はまた、文学において最も顕著な技法のいくつかを対比している。
論文 参考訳(メタデータ) (2020-07-16T09:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。