論文の概要: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity
Detection by Incorporating Domain Knowledge
- arxiv url: http://arxiv.org/abs/2301.00511v2
- Date: Mon, 22 May 2023 02:01:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 13:48:17.442954
- Title: Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity
Detection by Incorporating Domain Knowledge
- Title(参考訳): asteria-pro: ドメイン知識を組み込んだディープラーニングベースのバイナリコード類似性検出
- Authors: Shouguo Yang, Chaopeng Dong, Yang Xiao, Yiran Cheng, Zhiqiang Shi, Zhi
Li, and Limin Sun
- Abstract要約: 本稿では,ドメイン知識に基づく事前フィルタリングと再分類モジュールを組み込んだ新しいディープラーニング強化アーキテクチャを提案する。
Asteria-Proは、高い精度で1,482の脆弱な関数を91.65%検出する。
- 参考スコア(独自算出の注目度): 8.93208472340743
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The widespread code reuse allows vulnerabilities to proliferate among a vast
variety of firmware. There is an urgent need to detect these vulnerable code
effectively and efficiently. By measuring code similarities, AI-based binary
code similarity detection is applied to detecting vulnerable code at scale.
Existing studies have proposed various function features to capture the
commonality for similarity detection. Nevertheless, the significant code
syntactic variability induced by the diversity of IoT hardware architectures
diminishes the accuracy of binary code similarity detection. In our earlier
study and the tool Asteria, we adopt a Tree-LSTM network to summarize function
semantics as function commonality and the evaluation result indicates an
advanced performance. However, it still has utility concerns due to excessive
time costs and inadequate precision while searching for large-scale firmware
bugs.
To this end, we propose a novel deep learning enhancement architecture by
incorporating domain knowledge-based pre-filtration and re-ranking modules, and
we develop a prototype based on Asteria called Asteria-Pro. Pre-filtration
module seeks to eliminates dissimilar functions to boost subsequent deep
learning model calculations, while re-ranking module aims to raises the
rankings of vulnerable functions among candidates generated by deep learning
model. Our evaluation indicates that pre-filtration module cuts the calculation
time by 96.9% and re-ranking improves MRR and Recall by 23.71% and 36.4%. By
incorporating the pre-filtration and re-ranking modules, Asteria-Pro
outperforms existing state-of-the-art approaches in bug search task, by a
significant large margin. We conduct a large-scale real-world firmware bug
search and Asteria-Pro manages to detect 1,482 vulnerable functions with a high
precision 91.65%.
- Abstract(参考訳): コード再利用の普及により、さまざまなファームウェア間で脆弱性が拡散する。
脆弱性のあるコードを効果的かつ効率的に検出する必要がある。
コード類似度を測定することにより、AIベースのバイナリコード類似度検出が、大規模な脆弱性コードの検出に適用される。
既存の研究は類似性検出の共通性を捉えるために様々な機能的特徴を提案している。
しかしながら、iotハードウェアアーキテクチャの多様性によって引き起こされる重要なコード構文の変動性は、バイナリコードの類似性検出の精度を低下させる。
先行研究とツールasteriaでは,tree-lstmネットワークを用いて関数意味論を関数の共通性として要約し,評価結果から高度な性能を示す。
しかし、大規模なファームウェアのバグを探しながら、過度な時間的コストと不適切な精度のために、実用上の懸念がある。
この目的のために,ドメイン知識に基づく事前フィルタリングと再ランキングモジュールを組み込んだ新しいディープラーニング拡張アーキテクチャを提案し,asteria-proと呼ばれるasteriaベースのプロトタイプを開発した。
事前フィルタリングモジュールは、その後のディープラーニングモデル計算を促進するために異種関数を排除し、再ランク付けモジュールは、ディープラーニングモデルが生成する候補の中で脆弱な関数のランクを上げることを目的としている。
評価の結果, プレフィルタモジュールは計算時間を96.9%削減し, MRRとリコールを23.71%, 36.4%改善した。
Asteria-Proは、プレフィルタと再ランクモジュールを組み込むことで、バグ検索タスクにおける既存の最先端のアプローチよりも大幅にパフォーマンスが向上する。
我々は大規模な実世界のファームウェアのバグサーチを行い、Asteria-Proは91.65%の精度で1,482の脆弱な機能を検出する。
関連論文リスト
- Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification [6.975902383951604]
現在の手法は、予測不可能なアウトリーチ分布で困難に直面している。
本稿では,これらの課題に対処するため,Dual for Threshold-Based Re-Classification (DETER)を提案する。
我々のモデルは以前のベンチマークより優れており、未知のインテントに対するF1スコアの13%と5%に向上しています。
論文 参考訳(メタデータ) (2024-05-30T11:46:42Z) - Bridging the Gap Between End-to-End and Two-Step Text Spotting [88.14552991115207]
ブリッジングテキストスポッティングは、2段階のメソッドでエラーの蓄積と最適化性能の問題を解決する新しいアプローチである。
提案手法の有効性を広範囲な実験により実証する。
論文 参考訳(メタデータ) (2024-04-06T13:14:04Z) - Code Detection for Hardware Acceleration Using Large Language Models [0.0]
本研究は,大規模言語モデル(LLM)を用いたコード検出の最初の解析である。
コード検出のための予備的かつ素直なプロンプトと,新しいプロンプト戦略を提案する。
その結果, GEMM, 畳み込み, FFTでは68.8%, 22.3%, 79.2%の精度が得られた。
我々の新たなプロンプト戦略は偽陽性を大幅に減らし, 総合的精度(91.1%, 97.9%, 99.7%)は良好である。
論文 参考訳(メタデータ) (2023-07-19T17:21:58Z) - A Dependable Hybrid Machine Learning Model for Network Intrusion
Detection [1.222622290392729]
本稿では,機械学習とディープラーニングを組み合わせたハイブリッドモデルを提案する。
提案手法は,KDDCUP'99とCIC-MalMem-2022の2つのデータセットでテストした場合,優れた結果が得られる。
論文 参考訳(メタデータ) (2022-12-08T20:19:27Z) - UniASM: Binary Code Similarity Detection without Fine-tuning [0.8271859911016718]
バイナリ関数の表現を学習するために,UniASMと呼ばれるトランスフォーマーベースのバイナリコード埋め込みモデルを提案する。
既知の脆弱性検索の現実的なタスクでは、UniASMは現在のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-10-28T14:04:57Z) - Clear Memory-Augmented Auto-Encoder for Surface Defect Detection [10.829080460965478]
本稿では,異常な前景を修復し,背景を鮮明に保存するメモリ拡張オートエンコーダを提案する。
できるだけ現実的で機能豊富な異常をシミュレートするために, 汎用的な人工異常生成アルゴリズムを提案する。
最後に,欠陥セグメンテーションのための新しいマルチスケール特徴残差検出法を提案する。
論文 参考訳(メタデータ) (2022-08-08T02:39:03Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Pairwise Supervised Hashing with Bernoulli Variational Auto-Encoder and
Self-Control Gradient Estimator [62.26981903551382]
バイナリ潜在変数を持つ変分自動エンコーダ(VAE)は、文書検索の精度の観点から最先端のパフォーマンスを提供する。
本稿では、クラス内類似度とクラス間類似度に報いるために、個別潜伏型VAEを用いたペアワイズ損失関数を提案する。
この新しいセマンティックハッシュフレームワークは、最先端技術よりも優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-05-21T06:11:33Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。