論文の概要: SCRIBE: Practical Static Binary Patching via Binary-Aware Recompilation of Decompiled Code
- arxiv url: http://arxiv.org/abs/2605.02121v1
- Date: Mon, 04 May 2026 00:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.091431
- Title: SCRIBE: Practical Static Binary Patching via Binary-Aware Recompilation of Decompiled Code
- Title(参考訳): SCRIBE: バイナリ・アウェア・リコンパイルによる静的バイナリ・パッチング
- Authors: Han Dai, Soumyakant Priyadarshan, Abdullah Imran, Ruoyu Wang, Antonio Bianchi,
- Abstract要約: SCRIBEは、非コンパイルコードの構文的および意味的問題を処理するパッチフレームワークである。
SCRIBEの新しい「バイナリ対応」再コンパイルアプローチは、デコンパイラ出力における意味的不正確性を修復する。
SCRIBEを用いて14の現実世界のCVEのうち13のパッチを、元のソースコードにアクセスすることなく適用可能であることを示す。
- 参考スコア(独自算出の注目度): 9.623962750101006
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When source code or the original toolchain is unavailable, patching binaries is difficult because it requires editing low-level assembly code directly. As an alternative, one can decompile the binary, apply the patch at the source level, and then recompile the modified code. However, as this paper demonstrates, this workflow is hindered by pervasive syntactic and semantic inaccuracies in the output of modern decompilers, many of which prior work has overlooked. To address these challenges, we present SCRIBE, a patching framework that handles syntactic and semantic issues in decompiled code, improving both recompilation success and correctness. SCRIBE's novel "binary-aware" recompilation approach repairs semantic inaccuracies in decompiler output by leveraging information extracted directly from the original binary. In our evaluation, SCRIBE resolved approximately 81% of previously incorrect functions produced by the Hex-Rays decompiler, demonstrating the effectiveness of its approach. Moreover, we show that, using SCRIBE, it is possible to patch 13 of 14 real-world CVEs without access to the original source code and without performing any manual binary editing. To further validate our findings, we conducted a user study with 18 participants. Using SCRIBE, participants achieved 100% patching success, compared to 3.7% without it. Finally, we asked three large language models to generate source-level patches via SCRIBE; all three achieved 100% success when using the framework, demonstrating its potential to enable fully automated patching. Overall, these results indicate that SCRIBE makes source-level patching of binaries accessible and reliable, even without access to the original source.
- Abstract(参考訳): ソースコードや元のツールチェーンが利用できない場合、バイナリのパッチは、低レベルのアセンブリコードを直接編集する必要があるため、難しい。
代替として、バイナリを逆コンパイルし、ソースレベルでパッチを適用し、修正されたコードを再コンパイルすることができる。
しかし、本稿が示すように、このワークフローは現代の逆コンパイラの出力における広汎な構文と意味的不正確さによって妨げられている。
これらの課題に対処するため、SCRIBEは、非コンパイルコードの構文的および意味的問題を処理し、再コンパイルの成功と正確性の両方を改善するパッチフレームワークである。
SCRIBEの新しい「バイナリ・アウェア」再コンパイルアプローチは、元のバイナリから直接抽出された情報を活用することで、デコンパイラ出力における意味的不正確性を修復する。
本評価では,Hex-Raysデコンパイラが生成した関数の約81%をSCRIBEが解き,その手法の有効性を実証した。
さらに,SCRIBEを用いることで,14の現実世界のCVEのうち13のパッチを,元のソースコードにアクセスすることなく,手作業によるバイナリ編集を行うことなく適用可能であることを示す。
その結果をさらに検証するため,18名の被験者を対象にユーザスタディを行った。
SCRIBEを使用することで、参加者は100%のパッチ適用に成功した。
最後に、私たちは3つの大きな言語モデルにSCRIBEを使ってソースレベルのパッチを生成するよう依頼しました。
これらの結果から,SCRIBEは元のソースにアクセスしなくても,バイナリのソースレベルのパッチングをアクセス可能で信頼性の高いものにすることが示された。
関連論文リスト
- Constraint-Guided Multi-Agent Decompilation for Executable Binary Recovery [48.82204413712889]
脱コンパイルは、セキュリティ分析、マルウェアのリバースエンジニアリング、レガシーソフトウェアメンテナンスに不可欠である。
マルチレベル制約誘導型デコンパイル(MCGD)により,デコンパイルされたコードを再実行可能なソースに変換するマルチエージェントフレームワークを提案する。
本フレームワークは,84~97%の再実行性を実現し,28~89ポイントのベースラインデコンパイラ出力を改善した。
論文 参考訳(メタデータ) (2026-04-27T01:28:11Z) - PCodeTrans: Translate Decompiled Pseudocode to Compilable and Executable Equivalent [8.576619291429969]
PCodeTransは、逆コンパイル、再コンパイル、厳密な関数レベルの動的検証のギャップを埋める。
99.55%と99.89%のテスト検証された動作一貫性とともに、ストリップされていないバイナリ上で100%の関数レベルのコンパイルが可能となる。
論文 参考訳(メタデータ) (2026-03-16T05:54:24Z) - Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - SALT4Decompile: Inferring Source-level Abstract Logic Tree for LLM-Based Binary Decompilation [17.58664677898224]
Saltmはバイナリとソースコードの間の安定した論理的特徴を抽象化する新しいバイナリ逆コンパイル法である。
Saltmはソースコードのロジックを回復するのに非常に効果的で、最先端のメソッドよりもはるかに優れている。
論文 参考訳(メタデータ) (2025-09-18T05:57:15Z) - Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。
この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。
バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文 参考訳(メタデータ) (2025-06-24T13:42:59Z) - D-LiFT: Improving LLM-based Decompiler Backend via Code Quality-driven Fine-tuning [49.16469288280772]
逆コンパイラは、バイナリから可読なソースコードを再構築する。
近年の進歩にもかかわらず、そのアウトプットは構文上の誤りや意味的な誤りに悩まされ、読みにくいままである。
大規模言語モデル (LLMs) の出現により、研究者は逆コンパイラ出力を洗練するためのLLMの可能性を探り始めた。
D-LIFTは、微調整強化学習を施した拡張逆コンパイラLLMパイプラインである。
論文 参考訳(メタデータ) (2025-06-11T19:09:08Z) - Decompile-Bench: Million-Scale Binary-Source Function Pairs for Real-World Binary Decompilation [18.28488002922524]
Decompile-Benchは、収集された1億の関数ペアから凝縮された200万のバイナリソース関数ペアからなる、最初のオープンソースデータセットである。
評価のために、よく確立されたHumanEvalとMBPPから手作業で作成したバイナリを含むDecompile-Bench-Evalのベンチマークを開発した。
Decompile-Benchによる微調整は、再実行可能性率の観点から、以前のベンチマークよりも20%改善されていることが分かりました。
論文 参考訳(メタデータ) (2025-05-19T03:34:33Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。