論文の概要: iCallee: Recovering Call Graphs for Binaries
- arxiv url: http://arxiv.org/abs/2111.01415v2
- Date: Wed, 3 Nov 2021 02:57:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 10:45:08.759523
- Title: iCallee: Recovering Call Graphs for Binaries
- Title(参考訳): iCallee: バイナリのコールグラフの復元
- Authors: Wenyu Zhu, Zhiyao Feng, Zihan Zhang, Zhijian Ou, Min Yang, Chao Zhang
- Abstract要約: 既存のバイナリの間接的な呼び出し元認識ソリューションは、すべて高い偽陽性と負の値を持ち、コールグラフは不正確である。
我々は,質問応答アプリケーションの進歩に触発された,シームズニューラルネットワークに基づく新しい解iCalleeを提案する。
我々はiCalleeのプロトタイプを実装し、いくつかのターゲットグループで評価した。
- 参考スコア(独自算出の注目度): 31.73821825871851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recovering programs' call graphs is crucial for inter-procedural analysis
tasks and applications based on them. The core challenge is recognizing targets
of indirect calls (i.e., indirect callees). It becomes more challenging if
target programs are in binary forms, due to information loss in binaries.
Existing indirect callee recognition solutions for binaries all have high false
positives and negatives, making call graphs inaccurate.
In this paper, we propose a new solution iCallee based on the Siamese Neural
Network, inspired by the advances in question-answering applications. The key
insight is that, neural networks can learn to answer whether a callee function
is a potential target of an indirect callsite by comprehending their contexts,
i.e., instructions nearby callsites and of callees. Following this insight, we
first preprocess target binaries to extract contexts of callsites and callees.
Then, we build a customized Natural Language Processing (NLP) model applicable
to assembly language. Further, we collect abundant pairs of callsites and
callees, and embed their contexts with the NLP model, then train a Siamese
network and a classifier to answer the callsite-callee question. We have
implemented a prototype of iCallee and evaluated it on several groups of
targets. Evaluation results showed that, our solution could match callsites to
callees with an F1-Measure of 93.7%, recall of 93.8%, and precision of 93.5%,
much better than state-of-the-art solutions. To show its usefulness, we apply
iCallee to two specific applications - binary code similarity detection and
binary program hardening, and found that it could greatly improve
state-of-the-art solutions.
- Abstract(参考訳): プログラムのコールグラフの復元は、手続き間分析タスクやそれに基づくアプリケーションにとって不可欠である。
主な課題は、間接呼び出し(すなわち間接呼び出し)のターゲットを認識することである。
バイナリの情報が失われるため、ターゲットプログラムがバイナリ形式であれば、より困難になる。
既存のバイナリの間接的な呼び出し元認識ソリューションはいずれも高い偽陽性と陰性を持ち、コールグラフは不正確である。
本稿では,シームズニューラルネットワークに基づく新しい解iCalleeを提案する。
重要な洞察は、ニューラルネットワークが、呼び出し先の関数が間接呼び出しの潜在的なターゲットであるかどうかを、そのコンテキスト、すなわち近くの呼び出し側と呼び出し側の指示を解釈することによって学習できるということだ。
この知見に従い、まずターゲットバイナリを前処理し、呼び出し元と呼び出し元のコンテキストを抽出する。
次に、アセンブリ言語に適用可能なカスタマイズされた自然言語処理(nlp)モデルを構築する。
さらに,大量のcalliteとcalleeのペアを収集し,そのコンテキストをnlpモデルに埋め込み,siameseネットワークと分類器を訓練してcallite-calleeの質問に答える。
我々はiCalleeのプロトタイプを実装し、いくつかのターゲットグループで評価した。
評価の結果, 提案手法は, f1測定値93.7%, 93.8%, 精度93.5%, 精度93.5%, 最先端のソリューションよりはるかに優れていた。
その有用性を示すために、iCalleeをバイナリコードの類似性検出とバイナリプログラムのハードニングという2つの特定のアプリケーションに適用し、最先端のソリューションを大幅に改善できることを発見した。
関連論文リスト
- Neural Retriever and Go Beyond: A Thesis Proposal [1.082365064737981]
Information Retriever (IR) は、あるクエリに関連するドキュメントを大規模に検索することを目的としている。
最近のニューラルベースアルゴリズム(ニューラルレトリバーと呼ばれる)は、従来の手法の限界を緩和できるほど注目を集めている。
論文 参考訳(メタデータ) (2022-05-31T17:59:30Z) - Automatic Relation-aware Graph Network Proliferation [182.30735195376792]
GNNを効率的に検索するためのARGNP(Automatic Relation-Aware Graph Network Proliferation)を提案する。
これらの操作は階層的なノード/リレーショナル情報を抽出し、グラフ上のメッセージパッシングのための異方的ガイダンスを提供する。
4つのグラフ学習タスクのための6つのデータセットの実験により、我々の手法によって生成されたGNNは、現在最先端の手作りおよび検索に基づくGNNよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-05-31T10:38:04Z) - Improved Aggregating and Accelerating Training Methods for Spatial Graph
Neural Networks on Fraud Detection [0.0]
本稿では,CARE-GNNをResidual Layered CARE-GNN(RLC-GNN)と呼ばれるディープモデルに拡張する改良されたディープアーキテクチャを提案する。
RLC-GNNの3つの課題は、近隣情報の利用が制限に達すること、訓練の難しさ、およびノードの特徴や外部パターンに関する包括的な考慮の欠如である。
YelpとAmazonのデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-02-14T09:51:35Z) - Very Deep Graph Neural Networks Via Noise Regularisation [57.450532911995516]
グラフニューラルネットワーク(GNN)は、入力グラフを介して学習されたメッセージパッシングを実行する。
最大100のメッセージパッシングステップを持つディープGNNをトレーニングし、いくつかの最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-15T08:50:10Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Question Answering over Knowledge Bases by Leveraging Semantic Parsing
and Neuro-Symbolic Reasoning [73.00049753292316]
本稿では,意味解析と推論に基づくニューロシンボリック質問回答システムを提案する。
NSQAはQALD-9とLC-QuAD 1.0で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-12-03T05:17:55Z) - Classifying Malware Using Function Representations in a Static Call
Graph [0.0]
本稿では,x86アセンブリ命令の関数コールグラフを用いて,マルウェア群を同定する深層学習手法を提案する。
われわれは,Microsoftのマルウェア分類データセット上でいくつかの実験を行い,99.41%の精度でマルウェア群を分離した。
論文 参考訳(メタデータ) (2020-12-01T20:36:19Z) - Global Optimization of Objective Functions Represented by ReLU Networks [77.55969359556032]
ニューラルネットワークは複雑で非敵対的な関数を学ぶことができ、安全クリティカルな文脈でそれらの正しい振る舞いを保証することは困難である。
ネットワーク内の障害を見つけるための多くのアプローチ(例えば、敵の例)があるが、これらは障害の欠如を保証できない。
本稿では,最適化プロセスを検証手順に統合し,本手法よりも優れた性能を実現する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T08:19:48Z) - Efficient Neural Query Auto Completion [17.58784759652327]
クエリオートコンプリートシステムでは,3つの大きな課題が報告されている。
従来のQACシステムは、検索ログのクエリ候補頻度などの手作り機能に依存している。
本稿では,これらの課題を克服するために,効果的なコンテキストモデリングを用いた効率的なニューラルネットワークQACシステムを提案する。
論文 参考訳(メタデータ) (2020-08-06T21:28:36Z) - Reasoning Visual Dialog with Sparse Graph Learning and Knowledge
Transfer [22.820709255518]
グラフ構造学習タスクとして視覚対話を定式化するためのスパースグラフ学習(SGL)手法を提案する。
次に,教師モデルから回答予測を抽出し,擬似ラベルとして利用する知識伝達(KT)手法を提案する。
提案手法は,ベースライン手法と比較して推論能力を大幅に向上させ,VisDial v1.0データセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-04-14T17:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。