論文の概要: Cross-Inlining Binary Function Similarity Detection
- arxiv url: http://arxiv.org/abs/2401.05739v1
- Date: Thu, 11 Jan 2024 08:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 19:39:27.815153
- Title: Cross-Inlining Binary Function Similarity Detection
- Title(参考訳): クロスインラインバイナリ関数類似性検出
- Authors: Ang Jia, Ming Fan, Xi Xu, Wuxia Jin, Haijun Wang, Ting Liu
- Abstract要約: クロスインラインマッチングのためのパターンベースモデルCI-Detectorを提案する。
以上の結果から,CI-Detectorは81%の精度でクロスインラインペアを検出し,97%のリコールを達成できた。
- 参考スコア(独自算出の注目度): 16.923959153965857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Binary function similarity detection plays an important role in a wide range
of security applications. Existing works usually assume that the query function
and target function share equal semantics and compare their full semantics to
obtain the similarity. However, we find that the function mapping is more
complex, especially when function inlining happens.
In this paper, we will systematically investigate cross-inlining binary
function similarity detection. We first construct a cross-inlining dataset by
compiling 51 projects using 9 compilers, with 4 optimizations, to 6
architectures, with 2 inlining flags, which results in two datasets both with
216 combinations. Then we construct the cross-inlining function mappings by
linking the common source functions in these two datasets. Through analysis of
this dataset, we find that three cross-inlining patterns widely exist while
existing work suffers when detecting cross-inlining binary function similarity.
Next, we propose a pattern-based model named CI-Detector for cross-inlining
matching. CI-Detector uses the attributed CFG to represent the semantics of
binary functions and GNN to embed binary functions into vectors. CI-Detector
respectively trains a model for these three cross-inlining patterns. Finally,
the testing pairs are input to these three models and all the produced
similarities are aggregated to produce the final similarity. We conduct several
experiments to evaluate CI-Detector. Results show that CI-Detector can detect
cross-inlining pairs with a precision of 81% and a recall of 97%, which exceeds
all state-of-the-art works.
- Abstract(参考訳): バイナリ関数の類似性検出は、幅広いセキュリティアプリケーションにおいて重要な役割を果たす。
既存の作業は通常、クエリ関数とターゲット関数が等しいセマンティクスを共有し、それらの完全なセマンティクスを比較して類似性を得る。
しかし、特に関数のインライン化が発生すると、関数マッピングはより複雑になる。
本稿では,二項関数の類似性検出を体系的に検討する。
まず,9つのコンパイラ,4つの最適化,6つのアーキテクチャ,2つのインラインフラグを使って51のプロジェクトをコンパイルすることで,クロスインラインデータセットを構築した。
次に、これらの2つのデータセットの共通ソース関数をリンクすることで、クロスインライン関数マッピングを構築する。
このデータセットを解析した結果、3つのクロスインライニングパターンが広く存在し、一方で既存の作業はクロスインライニングバイナリ関数類似性の検出に苦しむことがわかった。
次に,クロスインラインマッチングのためのCI-Detectorというパターンベースモデルを提案する。
CI-Detectorは、属性付きCFGを使用してバイナリ関数の意味を表現し、GNNはバイナリ関数をベクトルに埋め込む。
CI-Detectorはそれぞれ、3つのクロスインラインパターンのモデルをトレーニングする。
最後に、テストペアがこれら3つのモデルに入力され、生成されたすべての類似性が集約されて最終類似性が生成される。
CI-detectorを評価するためにいくつかの実験を行った。
以上の結果から,CI-Detectorは81%の精度でクロスインラインペアを検出し,97%のリコールを達成できた。
関連論文リスト
- Is Function Similarity Over-Engineered? Building a Benchmark [37.33020176141435]
我々は、現実世界のユースケースをよりよく反映した高品質なデータセットとテストからなるバイナリ関数類似性検出のための新しいベンチマークを構築します。
我々のベンチマークでは、関数の生のバイトだけを見て、分解やその他の前処理を必要としない新しい単純なベースラインが、複数の設定で最先端のパフォーマンスを達成できることが判明した。
論文 参考訳(メタデータ) (2024-10-30T03:59:46Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - The object detection model uses combined extraction with KNN and RF classification [0.0]
本研究は,GLCMとLCPを特徴ベクトルとして組み合わせた新しい手法と,分類のためのVEによる物体検出の分野に寄与する。
システムテストでは4,437枚の2D画像のデータセットを使用し、KNNの精度は92.7%、F1スコアは92.5%、RF性能は低かった。
論文 参考訳(メタデータ) (2024-05-09T05:21:42Z) - FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [54.27040631527217]
削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。
まず、自然言語における暗号関数のセマンティクスを要約するために、バイナリ大言語モデル(FoC-BinLLM)を構築した。
次に、FoC-BinLLM上にバイナリコード類似モデル(FoC-Sim)を構築し、変更に敏感な表現を作成し、データベース内の未知の暗号関数の類似実装を検索する。
論文 参考訳(メタデータ) (2024-03-27T09:45:33Z) - FASER: Binary Code Similarity Search through the use of Intermediate
Representations [0.8594140167290099]
クロスアーキテクチャバイナリコード類似性検索は、多くの研究で研究されている。
本稿では,Function as a String Encoded Representation (FASER)を提案する。
論文 参考訳(メタデータ) (2023-10-05T15:36:35Z) - SCVCNet: Sliding cross-vector convolution network for cross-task and
inter-individual-set EEG-based cognitive workload recognition [15.537230343119875]
本稿では,脳波パターンを利用した認知作業量認識装置の汎用的手法を提案する。
パワースペクトル密度の微細な周波数構造を解析することにより,脳波のタスクおよび個々のセットに関する干渉を除去するSCVCNetというニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-21T13:06:30Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - UniASM: Binary Code Similarity Detection without Fine-tuning [0.8271859911016718]
バイナリ関数の表現を学習するために,UniASMと呼ばれるトランスフォーマーベースのバイナリコード埋め込みモデルを提案する。
既知の脆弱性検索の現実的なタスクでは、UniASMは現在のベースラインをすべて上回っている。
論文 参考訳(メタデータ) (2022-10-28T14:04:57Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。