論文の概要: Resolving Indirect Calls in Binary Code via Cross-Reference Augmented Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2507.18801v1
- Date: Thu, 24 Jul 2025 20:54:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.753586
- Title: Resolving Indirect Calls in Binary Code via Cross-Reference Augmented Graph Neural Networks
- Title(参考訳): クロス参照拡張グラフニューラルネットワークによるバイナリコードの間接呼び出しの解消
- Authors: Haotian Zhang, Kun Liu, Cristian Garces, Chenke Luo, Yu Lei, Jiang Ming,
- Abstract要約: NeuCallは、グラフニューラルネットワークを使用して間接呼び出しを解決するための新しいアプローチである。
我々は,高度なコンパイラレベルの型解析を利用して,高品質なコールライトとキャリーのトレーニングペアを生成する。
NeuCallは95.2%のF1スコアを獲得し、最先端のMLベースのアプローチを上回っている。
- 参考スコア(独自算出の注目度): 13.11143749397866
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Binary code analysis is essential in scenarios where source code is unavailable, with extensive applications across various security domains. However, accurately resolving indirect call targets remains a longstanding challenge in maintaining the integrity of static analysis in binary code. This difficulty arises because the operand of a call instruction (e.g., call rax) remains unknown until runtime, resulting in an incomplete inter-procedural control flow graph (CFG). Previous approaches have struggled with low accuracy and limited scalability. To address these limitations, recent work has increasingly turned to machine learning (ML) to enhance analysis. However, this ML-driven approach faces two significant obstacles: low-quality callsite-callee training pairs and inadequate binary code representation, both of which undermine the accuracy of ML models. In this paper, we introduce NeuCall, a novel approach for resolving indirect calls using graph neural networks. Existing ML models in this area often overlook key elements such as data and code cross-references, which are essential for understanding a program's control flow. In contrast, NeuCall augments CFGs with cross-references, preserving rich semantic information. Additionally, we leverage advanced compiler-level type analysis to generate high-quality callsite-callee training pairs, enhancing model precision and reliability. We further design a graph neural model that leverages augmented CFGs and relational graph convolutions for accurate target prediction. Evaluated against real-world binaries from GitHub and the Arch User Repository on x86_64 architecture, NeuCall achieves an F1 score of 95.2%, outperforming state-of-the-art ML-based approaches. These results highlight NeuCall's effectiveness in building precise inter-procedural CFGs and its potential to advance downstream binary analysis and security applications.
- Abstract(参考訳): バイナリコード解析は、ソースコードが利用できないシナリオにおいて必須であり、様々なセキュリティドメインにまたがる広範なアプリケーションがある。
しかし、間接呼び出しターゲットの正確な解決は、バイナリコードの静的解析の整合性を維持する上で、長年にわたる課題である。
この困難は、呼び出し命令(例えば、rax)のオペランドが実行時まで不明であり、不完全なプロセス間制御フローグラフ(CFG)となるため生じる。
これまでのアプローチは、低い精度と限られたスケーラビリティで苦労してきた。
これらの制限に対処するため、最近の研究は分析を強化するために機械学習(ML)に変わりつつある。
しかし、このML駆動のアプローチは、低品質のコールライト・カリートレーニングペアと不十分なバイナリコード表現の2つの大きな障害に直面しており、どちらもMLモデルの精度を損なう。
本稿では,グラフニューラルネットワークを用いた間接呼び出しの解法であるNeuCallを紹介する。
この領域の既存のMLモデルは、しばしば、プログラムの制御フローを理解するのに不可欠なデータやコード相互参照といった重要な要素を見落とします。
対照的に、NeuCallはCFGを相互参照で拡張し、リッチなセマンティック情報を保存する。
さらに、高度なコンパイラレベルの型解析を利用して、高品質なコールライト・カリートレーニングペアを生成し、モデルの精度と信頼性を向上させる。
さらに、拡張CFGとリレーショナルグラフ畳み込みを利用して正確な目標予測を行うグラフニューラルモデルを設計する。
GitHubの現実のバイナリとx86_64アーキテクチャのArch User Repositoryに対して評価されたNeuCallは、F1スコア95.2%を獲得し、最先端のMLベースのアプローチを上回っている。
これらの結果から、NeuCallが正確にプロデューラルなCFGを構築することの有効性と、下流のバイナリ分析とセキュリティアプリケーションを前進させる可能性を強調した。
関連論文リスト
- Fast State-Augmented Learning for Wireless Resource Allocation with Dual Variable Regression [83.27791109672927]
本稿では,資源割当ポリシに対する状態拡張グラフニューラルネットワーク(GNN)のパラメトリゼーションが,ユビキタスな二段階的手法の欠点を回避する方法を示す。
ラグランジアンによる国家拡張政策の最大化は、オフライントレーニングフェーズ中に学習される。
収束結果と指数確率は、双対函数(有限値)最適性ギャップの剰余に縛られることを証明する。
論文 参考訳(メタデータ) (2025-06-23T15:20:58Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Know Your Neighborhood: General and Zero-Shot Capable Binary Function Search Powered by Call Graphlets [0.7646713951724013]
本稿では,コールグラフレットと呼ばれる新しいグラフデータ表現を組み合わせた,新しいグラフニューラルネットワークアーキテクチャを提案する。
専門的なグラフニューラルネットワークモデルは、このグラフ表現に基づいて動作し、セマンティックバイナリコードの類似性を符号化する特徴ベクトルにマッピングすることを学ぶ。
実験結果から,コールグラフレットと新しいグラフニューラルネットワークアーキテクチャを組み合わせることで,同等あるいは最先端の性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-06-02T18:26:50Z) - Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。
入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。
私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文 参考訳(メタデータ) (2024-03-04T16:21:54Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - Normalizing Flow-based Neural Process for Few-Shot Knowledge Graph
Completion [69.55700751102376]
FKGC (Few-shot Knowledge Graph completion) は、失明した事実を、無意味な関連のある事実で予測することを目的としている。
既存のFKGC手法はメートル法学習やメタラーニングに基づいており、しばしば分布外や過度に適合する問題に悩まされる。
本稿では,数ショット知識グラフ補完(NP-FKGC)のためのフローベースニューラルプロセスの正規化を提案する。
論文 参考訳(メタデータ) (2023-04-17T11:42:28Z) - iCallee: Recovering Call Graphs for Binaries [31.73821825871851]
既存のバイナリの間接的な呼び出し元認識ソリューションは、すべて高い偽陽性と負の値を持ち、コールグラフは不正確である。
我々は,質問応答アプリケーションの進歩に触発された,シームズニューラルネットワークに基づく新しい解iCalleeを提案する。
我々はiCalleeのプロトタイプを実装し、いくつかのターゲットグループで評価した。
論文 参考訳(メタデータ) (2021-11-02T08:08:18Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Unveiling the potential of Graph Neural Networks for robust Intrusion
Detection [2.21481607673149]
本稿では,グラフとして構造化された攻撃の流れパターンを学習するための新しいグラフニューラルネットワーク(GNN)モデルを提案する。
我々のモデルは従来の実験と同等の精度を維持することができる一方、最先端のML技術は敵攻撃下で50%の精度(F1スコア)を低下させる。
論文 参考訳(メタデータ) (2021-07-30T16:56:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。