論文の概要: Adding Compilation Metadata To Binaries To Make Disassembly Decidable
- arxiv url: http://arxiv.org/abs/2604.19628v1
- Date: Tue, 21 Apr 2026 16:16:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.863644
- Title: Adding Compilation Metadata To Binaries To Make Disassembly Decidable
- Title(参考訳): バイナリにコンパイルメタデータを追加して分解しやすくする
- Authors: Daniel Engel, Freek Verbeek, Pranav Kumar, Binoy Ravindran,
- Abstract要約: 削除されたブラックボックスバイナリとオープンソースの間の中間となるバイナリフォーマットを提案する。
コンパイラの意図を捉えたメタデータを生成し、バイナリに挿入するツールを提供する。
評価の結果,メタデータの追加は実行時の動作やパフォーマンスに影響を与えないことがわかった。
- 参考スコア(独自算出の注目度): 7.000574089361166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The binary executable format is the standard method for distributing and executing software. Yet, it is also as opaque a representation of software as can be. If the binary format were augmented with metadata that provides security-relevant information, such as which data is intended by the compiler to be executable instructions, or how memory regions are expected to be bounded, that would dramatically improve the safety and maintainability of software. In this paper, we propose a binary format that is a middle ground between a stripped black-box binary and open source. We provide a tool that generates metadata capturing the compiler's intent and inserts it into the binary. This metadata enables lifting to a correct and recompilable higher-level representation and makes analysis and instrumentation more reliable. Our evaluation shows that adding metadata does not affect runtime behavior or performance. Compared to DWARF, our metadata is roughly 17% of its size. We validate correctness by compiling a comprehensive set of real-world C and C++ binaries and demonstrating that they can be lifted, instrumented, and recompiled without altering their behavior.
- Abstract(参考訳): バイナリ実行可能フォーマットは、ソフトウェアを配布および実行するための標準的な方法である。
しかし、ソフトウェアを表現することはできる限り不透明である。
もしバイナリフォーマットが、コンパイラが実行可能命令を意図しているデータや、メモリ領域のバウンドが期待されているようなセキュリティ関連情報を提供するメタデータで拡張された場合、ソフトウェアの安全性と保守性は劇的に向上する。
本稿では,削除されたブラックボックスバイナリとオープンソースの間の中間となるバイナリフォーマットを提案する。
コンパイラの意図を捉えたメタデータを生成し、バイナリに挿入するツールを提供する。
このメタデータは、正しく再コンパイル可能な高レベル表現へのリフトを可能にし、分析とインスツルメンテーションをより信頼性の高いものにする。
評価の結果,メタデータの追加は実行時の動作やパフォーマンスに影響を与えないことがわかった。
DWARFと比較すると、私たちのメタデータはその大きさの約17%です。
実世界のCとC++のバイナリを包括的にコンパイルし、それらの振る舞いを変えることなく、持ち上げ、計測、再コンパイルできることを実証することによって、正確性を検証する。
関連論文リスト
- Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - Transformers from Compressed Representations [74.48571451824569]
TEMPEST (TransformErs froM comPressed rEpreSenTations) は、圧縮されたファイルのバイトストリーム構造を利用して効果的なトークン化と符号化戦略を設計する手法である。
本提案では,意味分類に必要なトークン数を大幅に削減し,計算複雑性とメモリ使用量の両方を削減する。
論文 参考訳(メタデータ) (2025-10-26T13:48:03Z) - Decompile-Bench: Million-Scale Binary-Source Function Pairs for Real-World Binary Decompilation [18.28488002922524]
Decompile-Benchは、収集された1億の関数ペアから凝縮された200万のバイナリソース関数ペアからなる、最初のオープンソースデータセットである。
評価のために、よく確立されたHumanEvalとMBPPから手作業で作成したバイナリを含むDecompile-Bench-Evalのベンチマークを開発した。
Decompile-Benchによる微調整は、再実行可能性率の観点から、以前のベンチマークよりも20%改善されていることが分かりました。
論文 参考訳(メタデータ) (2025-05-19T03:34:33Z) - cozy: Comparative Symbolic Execution for Binary Programs [0.6999740786886538]
cozyは、ソフトウェアバイナリの2つのバージョンの違いを分析し、視覚化するツールである。
cozyにはWebベースのビジュアルインターフェースがあり、比較結果を見ることができる。
論文 参考訳(メタデータ) (2025-03-31T18:59:30Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - StrTune: Data Dependence-based Code Slicing for Binary Similarity Detection with Fine-tuned Representation [5.41477941455399]
BCSDは、悪意のあるコードスニペットの識別や、コードパターンの比較によるバイナリパッチ解析といったバイナリタスクに対処することができる。
バイナリは異なるコンパイル構成でコンパイルされるため、既存のアプローチはバイナリの類似性を比較する際にも注目すべき制限に直面している。
データ依存に基づいてバイナリコードをスライスし,スライスレベルの微調整を行うStrTuneを提案する。
論文 参考訳(メタデータ) (2024-11-19T12:20:08Z) - FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [51.898805184427545]
削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。
まず、自然言語における暗号関数のセマンティクスを要約するために、バイナリ大言語モデル(FoC-BinLLM)を構築した。
次に、FoC-BinLLM上にバイナリコード類似モデル(FoC-Sim)を構築し、変更に敏感な表現を作成し、データベース内の未知の暗号関数の類似実装を検索する。
論文 参考訳(メタデータ) (2024-03-27T09:45:33Z) - BinGo: Identifying Security Patches in Binary Code with Graph
Representation Learning [19.22004583230725]
バイナリコードに対する新しいセキュリティパッチ検出システムであるBinGoを提案する。
BinGoは、パッチデータ前処理、グラフ抽出、埋め込み生成、グラフ表現学習の4つのフェーズで構成されている。
実験の結果、BinGoは隣り合う2つのバイナリコードのセキュリティパッチを80.77%の精度で識別できることがわかった。
論文 参考訳(メタデータ) (2023-12-13T06:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。