論文の概要: Superset Decompilation
- arxiv url: http://arxiv.org/abs/2603.28002v1
- Date: Mon, 30 Mar 2026 03:47:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.21783
- Title: Superset Decompilation
- Title(参考訳): Superset Decompilation
- Authors: Chang Liu, Yihao Sun, Thomas Gilray, Kristopher Micinski,
- Abstract要約: decompilationはコンパイルの逆で、モジュラーパスのシーケンスとして構成できる。
我々はこれを、バイナリに関する事実を一元的にリレーショナルストアに導出するフレームワークである、証明誘導スーパーセットデコンパイル(PGSD)として定式化する。
Mandelは、宣言的なリバースエンジニアリングフレームワークとしてPGSDを実装しており、Linux ELFバイナリを35K行のRustとDatalogの粒度の中間表現を通じてC99に引き上げている。
- 参考スコア(独自算出の注目度): 7.989066784325648
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reverse engineering tools remain monolithic and imperative compared to the advancement of modern compiler architectures: analyses are tied to a single mutable representation, making them difficult to extend or refine, and forcing premature choices between soundness and precision. We observe that decompilation is the reverse of compilation and can be structured as a sequence of modular passes, each performing a granular and clearly defined interpretation of the binary at a progressively higher level of abstraction. We formalize this as provenance-guided superset decompilation (PGSD), a framework that monotonically derives facts about the binary into a relation store. Instead of committing early to a single interpretation, the pipeline retains ambiguous interpretations as parallel candidates with provenance, deferring resolution until the final selection phase. Manifold implements PGSD as a declarative reverse engineering framework that lifts Linux ELF binaries to C99 through a granular intermediate representation in ~35K lines of Rust and Datalog. On GNU coreutils, Manifold's output quality matches Ghidra, IDA Pro, angr, and RetDec on multiple metrics while producing fewer compiler errors, and generalizes across compilers and optimization levels.
- Abstract(参考訳): 分析は単一の可変表現に結びついており、拡張や洗練が困難であり、音質と精度の早期選択を強制する。
分解はコンパイルの逆であり、モジュールパスのシーケンスとして構造化され、それぞれが徐々に高い抽象レベルで粒度と明確に定義されたバイナリの解釈を実行する。
我々はこれを、バイナリに関する事実を一元的にリレーショナルストアに導出するフレームワークである、証明誘導スーパーセットデコンパイル(PGSD)として定式化する。
パイプラインは1つの解釈に早期にコミットする代わりに、最終選択フェーズまで分解を遅らせ、証明された並列候補として曖昧な解釈を保持する。
Manifoldは,宣言的なリバースエンジニアリングフレームワークとしてPGSDを実装している。Linux ELFバイナリを,RustとDatalogの約35K行の粒度の中間表現を通じて,C99にリフトする。
GNUコアユーティリティでは、Manifoldの出力品質はGhidra、IDA Pro、angr、RetDecと複数のメトリクスで一致し、コンパイラエラーが少なくなり、コンパイラと最適化レベルをまたいで一般化される。
関連論文リスト
- PCodeTrans: Translate Decompiled Pseudocode to Compilable and Executable Equivalent [8.576619291429969]
PCodeTransは、逆コンパイル、再コンパイル、厳密な関数レベルの動的検証のギャップを埋める。
99.55%と99.89%のテスト検証された動作一貫性とともに、ストリップされていないバイナリ上で100%の関数レベルのコンパイルが可能となる。
論文 参考訳(メタデータ) (2026-03-16T05:54:24Z) - Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - Compiling by Proving: Language-Agnostic Automatic Optimization from Formal Semantics [0.0]
シンボル実行とグラフ構造のコンパイルにより全パス到達可能性証明を構築する。
我々は、多くの意味的な書き直しを単一のルールに集約し、建設による正確性を維持します。
我々はこれを言語に依存しないKフレームワークの拡張として実装する。
論文 参考訳(メタデータ) (2025-09-26T02:49:08Z) - Extractive Fact Decomposition for Interpretable Natural Language Inference in one Forward Pass [4.990228412613982]
JEDIは、原子の事実分解と解釈可能な推論を共同で行うエンコーダのみのアーキテクチャである。
学習を容易にするため、複数のNLIベンチマークをカバーする合成的合理性の大規模なコーパスを生成する。
本研究は, エンコーダのみのアーキテクチャと合成論理を用いて, NLIの解釈可能性とロバストな一般化を実現することができることを示す。
論文 参考訳(メタデータ) (2025-09-23T11:30:42Z) - Stencil-Lifting: Hierarchical Recursive Lifting System for Extracting Summary of Stencil Kernel in Legacy Codes [12.182789082355058]
本稿では,低レベル言語で記述されたステンシルカーネルをドメイン特化言語に自動変換するシステムであるStencil-Liftingを紹介する。
Stencil-Liftingは2つの重要なイノベーションを通じてスケーラブルなステンシルカーネルの抽象化を実現する。
Stencil-Liftingは、2つの異なるスイートと4つの実世界のアプリケーションから様々なステンシルベンチマークで評価する。
論文 参考訳(メタデータ) (2025-09-12T13:30:18Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - StrTune: Data Dependence-based Code Slicing for Binary Similarity Detection with Fine-tuned Representation [5.41477941455399]
BCSDは、悪意のあるコードスニペットの識別や、コードパターンの比較によるバイナリパッチ解析といったバイナリタスクに対処することができる。
バイナリは異なるコンパイル構成でコンパイルされるため、既存のアプローチはバイナリの類似性を比較する際にも注目すべき制限に直面している。
データ依存に基づいてバイナリコードをスライスし,スライスレベルの微調整を行うStrTuneを提案する。
論文 参考訳(メタデータ) (2024-11-19T12:20:08Z) - Outline, Then Details: Syntactically Guided Coarse-To-Fine Code
Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。
自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文 参考訳(メタデータ) (2023-04-28T01:47:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。