論文の概要: iCallee: Recovering Call Graphs for Binaries
- arxiv url: http://arxiv.org/abs/2111.01415v1
- Date: Tue, 2 Nov 2021 08:08:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 14:40:11.593933
- Title: iCallee: Recovering Call Graphs for Binaries
- Title(参考訳): iCallee: バイナリのコールグラフの復元
- Authors: Wenyu Zhu, Zhiyao Feng, Zihan Zhang, Chao Zhang, Zhijian Ou, Min Yang
- Abstract要約: 既存のバイナリの間接的な呼び出し元認識ソリューションは、すべて高い偽陽性と負の値を持ち、コールグラフは不正確である。
我々は,質問応答アプリケーションの進歩に触発された,シームズニューラルネットワークに基づく新しい解iCalleeを提案する。
我々はiCalleeのプロトタイプを実装し、いくつかのターゲットグループで評価した。
- 参考スコア(独自算出の注目度): 31.73821825871851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recovering programs' call graphs is crucial for inter-procedural analysis
tasks and applications based on them. The core challenge is recognizing targets
of indirect calls (i.e., indirect callees). It becomes more challenging if
target programs are in binary forms, due to information loss in binaries.
Existing indirect callee recognition solutions for binaries all have high false
positives and negatives, making call graphs inaccurate.
In this paper, we propose a new solution iCallee based on the Siamese Neural
Network, inspired by the advances in question-answering applications. The key
insight is that, neural networks can learn to answer whether a callee function
is a potential target of an indirect callsite by comprehending their contexts,
i.e., instructions nearby callsites and of callees. Following this insight, we
first preprocess target binaries to extract contexts of callsites and callees.
Then, we build a customized Natural Language Processing (NLP) model applicable
to assembly language. Further, we collect abundant pairs of callsites and
callees, and embed their contexts with the NLP model, then train a Siamese
network and a classifier to answer the callsite-callee question. We have
implemented a prototype of iCallee and evaluated it on several groups of
targets. Evaluation results showed that, our solution could match callsites to
callees with an F1-Measure of 93.7%, recall of 93.8%, and precision of 93.5%,
much better than state-of-the-art solutions. To show its usefulness, we apply
iCallee to two specific applications - binary code similarity detection and
binary program hardening, and found that it could greatly improve
state-of-the-art solutions.
- Abstract(参考訳): プログラムのコールグラフの復元は、手続き間分析タスクやそれに基づくアプリケーションにとって不可欠である。
主な課題は、間接呼び出し(すなわち間接呼び出し)のターゲットを認識することである。
バイナリの情報が失われるため、ターゲットプログラムがバイナリ形式であれば、より困難になる。
既存のバイナリの間接的な呼び出し元認識ソリューションはいずれも高い偽陽性と陰性を持ち、コールグラフは不正確である。
本稿では,シームズニューラルネットワークに基づく新しい解iCalleeを提案する。
重要な洞察は、ニューラルネットワークが、呼び出し先の関数が間接呼び出しの潜在的なターゲットであるかどうかを、そのコンテキスト、すなわち近くの呼び出し側と呼び出し側の指示を解釈することによって学習できるということだ。
この知見に従い、まずターゲットバイナリを前処理し、呼び出し元と呼び出し元のコンテキストを抽出する。
次に、アセンブリ言語に適用可能なカスタマイズされた自然言語処理(nlp)モデルを構築する。
さらに,大量のcalliteとcalleeのペアを収集し,そのコンテキストをnlpモデルに埋め込み,siameseネットワークと分類器を訓練してcallite-calleeの質問に答える。
我々はiCalleeのプロトタイプを実装し、いくつかのターゲットグループで評価した。
評価の結果, 提案手法は, f1測定値93.7%, 93.8%, 精度93.5%, 精度93.5%, 最先端のソリューションよりはるかに優れていた。
その有用性を示すために、iCalleeをバイナリコードの類似性検出とバイナリプログラムのハードニングという2つの特定のアプリケーションに適用し、最先端のソリューションを大幅に改善できることを発見した。
関連論文リスト
- Multi-turn Response Selection with Commonsense-enhanced Language Models [32.921901489497714]
我々は、事前学習された言語モデルとグラフニューラルネットワーク(SinLG)が融合したシームズネットワークを設計する。
SinLGは、事前訓練された言語モデル(PLM)を利用して、文脈と応答候補における単語相関をキャッチする。
GNNはPLMの微調整を支援することを目的としており、関連する記憶を刺激してパフォーマンスの向上を目指している。
論文 参考訳(メタデータ) (2024-07-26T03:13:47Z) - Know Your Neighborhood: General and Zero-Shot Capable Binary Function Search Powered by Call Graphlets [0.7646713951724013]
本稿では,コールグラフレットと呼ばれる新しいグラフデータ表現を組み合わせた,新しいグラフニューラルネットワークアーキテクチャを提案する。
専門的なグラフニューラルネットワークモデルは、このグラフ表現に基づいて動作し、セマンティックバイナリコードの類似性を符号化する特徴ベクトルにマッピングすることを学ぶ。
実験結果から,コールグラフレットと新しいグラフニューラルネットワークアーキテクチャを組み合わせることで,同等あるいは最先端の性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-02T18:26:50Z) - Can Graph Learning Improve Planning in LLM-based Agents? [61.47027387839096]
言語エージェントにおけるタスクプランニングは、大規模言語モデル(LLM)の開発とともに重要な研究トピックとして浮上している。
本稿では,課題計画のためのグラフ学習に基づく手法について検討する。
我々のグラフ学習への関心は、注意のバイアスと自己回帰的損失が、グラフ上の意思決定を効果的にナビゲートするLLMの能力を妨げているという理論的な発見に起因している。
論文 参考訳(メタデータ) (2024-05-29T14:26:24Z) - Neural Retriever and Go Beyond: A Thesis Proposal [1.082365064737981]
Information Retriever (IR) は、あるクエリに関連するドキュメントを大規模に検索することを目的としている。
最近のニューラルベースアルゴリズム(ニューラルレトリバーと呼ばれる)は、従来の手法の限界を緩和できるほど注目を集めている。
論文 参考訳(メタデータ) (2022-05-31T17:59:30Z) - Improved Aggregating and Accelerating Training Methods for Spatial Graph
Neural Networks on Fraud Detection [0.0]
本稿では,CARE-GNNをResidual Layered CARE-GNN(RLC-GNN)と呼ばれるディープモデルに拡張する改良されたディープアーキテクチャを提案する。
RLC-GNNの3つの課題は、近隣情報の利用が制限に達すること、訓練の難しさ、およびノードの特徴や外部パターンに関する包括的な考慮の欠如である。
YelpとAmazonのデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-02-14T09:51:35Z) - Very Deep Graph Neural Networks Via Noise Regularisation [57.450532911995516]
グラフニューラルネットワーク(GNN)は、入力グラフを介して学習されたメッセージパッシングを実行する。
最大100のメッセージパッシングステップを持つディープGNNをトレーニングし、いくつかの最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-15T08:50:10Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Question Answering over Knowledge Bases by Leveraging Semantic Parsing
and Neuro-Symbolic Reasoning [73.00049753292316]
本稿では,意味解析と推論に基づくニューロシンボリック質問回答システムを提案する。
NSQAはQALD-9とLC-QuAD 1.0で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-12-03T05:17:55Z) - Classifying Malware Using Function Representations in a Static Call
Graph [0.0]
本稿では,x86アセンブリ命令の関数コールグラフを用いて,マルウェア群を同定する深層学習手法を提案する。
われわれは,Microsoftのマルウェア分類データセット上でいくつかの実験を行い,99.41%の精度でマルウェア群を分離した。
論文 参考訳(メタデータ) (2020-12-01T20:36:19Z) - Global Optimization of Objective Functions Represented by ReLU Networks [77.55969359556032]
ニューラルネットワークは複雑で非敵対的な関数を学ぶことができ、安全クリティカルな文脈でそれらの正しい振る舞いを保証することは困難である。
ネットワーク内の障害を見つけるための多くのアプローチ(例えば、敵の例)があるが、これらは障害の欠如を保証できない。
本稿では,最適化プロセスを検証手順に統合し,本手法よりも優れた性能を実現する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T08:19:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。