論文の概要: Bin2vec: Learning Representations of Binary Executable Programs for
Security Tasks
- arxiv url: http://arxiv.org/abs/2002.03388v2
- Date: Sat, 22 May 2021 17:27:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 14:35:41.618566
- Title: Bin2vec: Learning Representations of Binary Executable Programs for
Security Tasks
- Title(参考訳): Bin2vec: セキュリティタスクのためのバイナリ実行可能プログラムの学習
- Authors: Shushan Arakelyan, Sima Arasteh, Christophe Hauser, Erik Kline and
Aram Galstyan
- Abstract要約: 我々は、計算プログラムグラフとともに、GCN(Graph Convolutional Networks)を活用する新しいアプローチであるBin2vecを紹介する。
我々は,2つの意味的に異なるバイナリ解析タスクを解くために,我々の表現を用いることで,このアプローチの汎用性を実証する。
我々は、ソースコードベースのinst2vecアプローチと比較して、分類誤差を40%削減して、新しい最先端結果を設定した。
- 参考スコア(独自算出の注目度): 15.780176500971244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tackling binary program analysis problems has traditionally implied manually
defining rules and heuristics, a tedious and time-consuming task for human
analysts. In order to improve automation and scalability, we propose an
alternative direction based on distributed representations of binary programs
with applicability to a number of downstream tasks. We introduce Bin2vec, a new
approach leveraging Graph Convolutional Networks (GCN) along with computational
program graphs in order to learn a high dimensional representation of binary
executable programs. We demonstrate the versatility of this approach by using
our representations to solve two semantically different binary analysis tasks -
functional algorithm classification and vulnerability discovery. We compare the
proposed approach to our own strong baseline as well as published results and
demonstrate improvement over state-of-the-art methods for both tasks. We
evaluated Bin2vec on 49191 binaries for the functional algorithm classification
task, and on 30 different CWE-IDs including at least 100 CVE entries each for
the vulnerability discovery task. We set a new state-of-the-art result by
reducing the classification error by 40% compared to the source-code-based
inst2vec approach, while working on binary code. For almost every vulnerability
class in our dataset, our prediction accuracy is over 80% (and over 90% in
multiple classes).
- Abstract(参考訳): バイナリプログラム分析の問題に取り組むことは、伝統的に手動でルールやヒューリスティックを定義することを暗示している。
自動化と拡張性を改善するために,複数のダウンストリームタスクに適用可能なバイナリプログラムの分散表現に基づく代替方向性を提案する。
我々は,バイナリ実行プログラムの高次元表現を学ぶために,計算プログラムグラフとグラフ畳み込みネットワーク(gcn)を活用した新しいアプローチであるbin2vecを紹介する。
本手法の汎用性は,2つの意味論的に異なるバイナリ解析タスクのアルゴリズム分類と脆弱性発見を解くために,我々の表現を用いて実証する。
提案手法を我々の強固なベースラインと公開結果と比較し,両タスクの最先端手法に対する改善を実証した。
機能的アルゴリズム分類タスクでは49191バイナリに対してBin2vecを,脆弱性発見タスクでは少なくとも100のCVEエントリを含む30のCWE-ID上で評価した。
我々は、バイナリコードで作業しながら、ソースコードベースのinst2vecアプローチと比較して、分類エラーを40%削減して、新しい最先端結果を設定した。
データセットのほとんどすべての脆弱性クラスでは、予測精度は80%以上(複数のクラスでは90%以上)です。
関連論文リスト
- BinSimDB: Benchmark Dataset Construction for Fine-Grained Binary Code Similarity Analysis [6.093226756571566]
我々は、BinSimDBと呼ばれる細粒度のバイナリコード類似性解析のためのベンチマークデータセットを構築した。
具体的には,2つのバイナリコードスニペット間の相違を補うためのBMergeアルゴリズムとBPairアルゴリズムを提案する。
実験の結果、BinSimDBはバイナリコード類似性比較の性能を大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-10-14T05:13:48Z) - Know Your Neighborhood: General and Zero-Shot Capable Binary Function Search Powered by Call Graphlets [0.7646713951724013]
本稿では,コールグラフレットと呼ばれる新しいグラフデータ表現を組み合わせた,新しいグラフニューラルネットワークアーキテクチャを提案する。
専門的なグラフニューラルネットワークモデルは、このグラフ表現に基づいて動作し、セマンティックバイナリコードの類似性を符号化する特徴ベクトルにマッピングすることを学ぶ。
実験結果から,コールグラフレットと新しいグラフニューラルネットワークアーキテクチャを組み合わせることで,同等あるいは最先端の性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-02T18:26:50Z) - PEM: Representing Binary Program Semantics for Similarity Analysis via a
Probabilistic Execution Model [25.014876893315208]
本稿では,バイナリプログラムのセマンティクスを表現する新しい手法を提案する。
対象バイナリの入力空間とプログラムパス空間を効果的にサンプリングできる新しい確率的実行エンジンに基づいている。
実世界の35k機能を有する9つのプロジェクトに対する評価と6つの最先端技術との比較により,PEMは一般的な設定で96%の精度を達成できることが示された。
論文 参考訳(メタデータ) (2023-08-29T17:20:35Z) - Towards Better Out-of-Distribution Generalization of Neural Algorithmic
Reasoning Tasks [51.8723187709964]
ニューラルネットワーク推論タスクのOOD一般化について検討する。
目標は、ディープニューラルネットワークを使用して入出力ペアからアルゴリズムを学ぶことである。
論文 参考訳(メタデータ) (2022-11-01T18:33:20Z) - UniASM: Binary Code Similarity Detection without Fine-tuning [0.8271859911016718]
バイナリ関数の表現を学習するために,UniASMと呼ばれるトランスフォーマーベースのバイナリコード埋め込みモデルを提案する。
既知の脆弱性検索の現実的なタスクでは、UniASMは現在のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-10-28T14:04:57Z) - Towards Accurate Binary Neural Networks via Modeling Contextual
Dependencies [52.691032025163175]
既存のバイナリニューラルネットワーク(BNN)は主にバイナライズ機能を備えた局所畳み込みで動作する。
本稿では,二元系ニューラルモジュールの設計を新たに提案し,二元系ニューラルモジュールを大きなマージンで導く。
論文 参考訳(メタデータ) (2022-09-03T11:51:04Z) - Benchmarking Node Outlier Detection on Graphs [90.29966986023403]
グラフの外れ値検出は、多くのアプリケーションにおいて、新しいが重要な機械学習タスクである。
UNODと呼ばれるグラフに対して、最初の包括的教師なしノード外乱検出ベンチマークを示す。
論文 参考訳(メタデータ) (2022-06-21T01:46:38Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Semantic-aware Binary Code Representation with BERT [27.908093567605484]
バグ発見、マルウェア分析、コードクローン検出など、幅広いバイナリ分析アプリケーションでは、バイナリコード上でのコンテキスト意味の回復が必要である。
近年,バイナリのコード表現を自動再構築するために,機械学習に基づくバイナリ解析手法が提案されている。
本稿では,バイナリコードのセマンティックなコード表現を生成するためにBERTを利用するDeepSemanticを提案する。
論文 参考訳(メタデータ) (2021-06-10T03:31:29Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。
自動エンコーダのコンテキストでデコードすることで更新される。
ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文 参考訳(メタデータ) (2020-02-27T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。