論文の概要: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity
Detection by Incorporating Domain Knowledge
- arxiv url: http://arxiv.org/abs/2301.00511v2
- Date: Mon, 22 May 2023 02:01:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 13:48:17.442954
- Title: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity
Detection by Incorporating Domain Knowledge
- Title(参考訳): asteria-pro: ドメイン知識を組み込んだディープラーニングベースのバイナリコード類似性検出
- Authors: Shouguo Yang, Chaopeng Dong, Yang Xiao, Yiran Cheng, Zhiqiang Shi, Zhi
Li, and Limin Sun
- Abstract要約: 本稿では,ドメイン知識に基づく事前フィルタリングと再分類モジュールを組み込んだ新しいディープラーニング強化アーキテクチャを提案する。
Asteria-Proは、高い精度で1,482の脆弱な関数を91.65%検出する。
- 参考スコア(独自算出の注目度): 8.93208472340743
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The widespread code reuse allows vulnerabilities to proliferate among a vast
variety of firmware. There is an urgent need to detect these vulnerable code
effectively and efficiently. By measuring code similarities, AI-based binary
code similarity detection is applied to detecting vulnerable code at scale.
Existing studies have proposed various function features to capture the
commonality for similarity detection. Nevertheless, the significant code
syntactic variability induced by the diversity of IoT hardware architectures
diminishes the accuracy of binary code similarity detection. In our earlier
study and the tool Asteria, we adopt a Tree-LSTM network to summarize function
semantics as function commonality and the evaluation result indicates an
advanced performance. However, it still has utility concerns due to excessive
time costs and inadequate precision while searching for large-scale firmware
bugs.
To this end, we propose a novel deep learning enhancement architecture by
incorporating domain knowledge-based pre-filtration and re-ranking modules, and
we develop a prototype based on Asteria called Asteria-Pro. Pre-filtration
module seeks to eliminates dissimilar functions to boost subsequent deep
learning model calculations, while re-ranking module aims to raises the
rankings of vulnerable functions among candidates generated by deep learning
model. Our evaluation indicates that pre-filtration module cuts the calculation
time by 96.9% and re-ranking improves MRR and Recall by 23.71% and 36.4%. By
incorporating the pre-filtration and re-ranking modules, Asteria-Pro
outperforms existing state-of-the-art approaches in bug search task, by a
significant large margin. We conduct a large-scale real-world firmware bug
search and Asteria-Pro manages to detect 1,482 vulnerable functions with a high
precision 91.65%.
- Abstract(参考訳): コード再利用の普及により、さまざまなファームウェア間で脆弱性が拡散する。
脆弱性のあるコードを効果的かつ効率的に検出する必要がある。
コード類似度を測定することにより、AIベースのバイナリコード類似度検出が、大規模な脆弱性コードの検出に適用される。
既存の研究は類似性検出の共通性を捉えるために様々な機能的特徴を提案している。
しかしながら、iotハードウェアアーキテクチャの多様性によって引き起こされる重要なコード構文の変動性は、バイナリコードの類似性検出の精度を低下させる。
先行研究とツールasteriaでは,tree-lstmネットワークを用いて関数意味論を関数の共通性として要約し,評価結果から高度な性能を示す。
しかし、大規模なファームウェアのバグを探しながら、過度な時間的コストと不適切な精度のために、実用上の懸念がある。
この目的のために,ドメイン知識に基づく事前フィルタリングと再ランキングモジュールを組み込んだ新しいディープラーニング拡張アーキテクチャを提案し,asteria-proと呼ばれるasteriaベースのプロトタイプを開発した。
事前フィルタリングモジュールは、その後のディープラーニングモデル計算を促進するために異種関数を排除し、再ランク付けモジュールは、ディープラーニングモデルが生成する候補の中で脆弱な関数のランクを上げることを目的としている。
評価の結果, プレフィルタモジュールは計算時間を96.9%削減し, MRRとリコールを23.71%, 36.4%改善した。
Asteria-Proは、プレフィルタと再ランクモジュールを組み込むことで、バグ検索タスクにおける既存の最先端のアプローチよりも大幅にパフォーマンスが向上する。
我々は大規模な実世界のファームウェアのバグサーチを行い、Asteria-Proは91.65%の精度で1,482の脆弱な機能を検出する。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Code Detection for Hardware Acceleration Using Large Language Models [0.0]
本研究は,大規模言語モデル(LLM)を用いたコード検出の最初の解析である。
コード検出のための予備的かつ素直なプロンプトと,新しいプロンプト戦略を提案する。
その結果, GEMM, 畳み込み, FFTでは68.8%, 22.3%, 79.2%の精度が得られた。
我々の新たなプロンプト戦略は偽陽性を大幅に減らし, 総合的精度(91.1%, 97.9%, 99.7%)は良好である。
論文 参考訳(メタデータ) (2023-07-19T17:21:58Z) - Limits of Machine Learning for Automatic Vulnerability Detection [0.0]
自動脆弱性検出のための機械学習の最近の成果は非常に有望である。
しかし、これらの結果が一般的なものであり、データセットに特有でないことをどうやって知るのか?
トレーニングセットまたはテストセットの増幅中に意味保存変換を適用するクロスバリデーションアルゴリズムを提案する。
改善されたロバスト性は、トレーニングデータ増幅時に使用される特定の変換にのみ適用される。
論文 参考訳(メタデータ) (2023-06-28T08:41:39Z) - DTAAD: Dual Tcn-Attention Networks for Anomaly Detection in Multivariate
Time Series Data [0.0]
本稿では,DTAADの異常検出と診断モデルを提案する。
6つのデータセットに対する実験により、DTAADは検出および診断性能の両方において、現在最も先進的なベースライン法を超えていることが確認された。
DTAADはF1のスコアを8.38%で改善し、ベースラインに比べてトレーニング時間を99%下げた。
論文 参考訳(メタデータ) (2023-02-17T06:59:45Z) - A Dependable Hybrid Machine Learning Model for Network Intrusion
Detection [1.222622290392729]
本稿では,機械学習とディープラーニングを組み合わせたハイブリッドモデルを提案する。
提案手法は,KDDCUP'99とCIC-MalMem-2022の2つのデータセットでテストした場合,優れた結果が得られる。
論文 参考訳(メタデータ) (2022-12-08T20:19:27Z) - UniASM: Binary Code Similarity Detection without Fine-tuning [0.8271859911016718]
バイナリ関数の表現を学習するために,UniASMと呼ばれるトランスフォーマーベースのバイナリコード埋め込みモデルを提案する。
既知の脆弱性検索の現実的なタスクでは、UniASMは現在のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-10-28T14:04:57Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。