論文の概要: Deterministic Fully-Static Whole-Binary Translation without Heuristics
- arxiv url: http://arxiv.org/abs/2605.08419v2
- Date: Wed, 13 May 2026 21:22:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.366969
- Title: Deterministic Fully-Static Whole-Binary Translation without Heuristics
- Title(参考訳): ヒューリスティックスを含まない決定論的完全二項翻訳
- Authors: Hongyu Chen, James McGowan, Michael Franz,
- Abstract要約: Elevatorはx86-64実行ファイル全体をAArch64デバッグ情報、ソースコード、コードレイアウトに関する仮定に変換する。
我々は,SPECint 2006スイート全体を含む,現実世界のバイナリの多種多様なコーパス上でエレベータを評価する。
- 参考スコア(独自算出の注目度): 4.112095753709181
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Elevator, the first binary translator that statically translates entire x86-64 executables to AArch64 without debug information, source code, or assumptions about code layout. Unlike existing systems, which rely on heuristics or runtime fallbacks to handle code-versus-data decoding errors, Elevator considers all possible interpretations of every byte and produces a separate translation for each feasible one ahead of time. Any byte may be interpreted as data, an opcode, or an opcode argument; we generate separate control flow paths for all interpretations, pruning only those leading to abnormal termination. Translations are built by composing code "tiles" automatically derived from a high-level description of the source ISA, yielding a nimble translation framework. The approach is deterministic and produces complete, self-contained binaries with no runtime component in the trusted code base. The principal cost is substantial code size expansion. The key benefit is that the output is the actual code that will run, enabling testing, validation, certification, and cryptographic signing prior to deployment, reducing risk compared to emulators or JIT compilers. We evaluate Elevator on a diverse corpus of real-world binaries, including the entire SPECint 2006 suite, demonstrating that static full-program binary translation can be both reliable and practical. Elevator achieves performance on par with or better than QEMU's user-mode JIT emulation.
- Abstract(参考訳): 我々は、x86-64実行ファイル全体をAArch64に静的に変換する最初のバイナリトランスレータであるElevatorを、デバッグ情報、ソースコード、コードレイアウトに関する仮定なしで提示する。
コード逆データデコードエラーを処理するためにヒューリスティックや実行時のフォールバックに依存する既存のシステムとは異なり、Elevatorはすべてのバイトの可能な解釈を考慮し、前もってそれぞれの実行可能データに対して個別の翻訳を生成する。
任意のバイトは、データ、オペコード、オペコード引数として解釈され、すべての解釈に対して別々の制御フローパスを生成し、異常終了につながるものだけをプルーニングする。
翻訳は、ソースISAの高レベルな記述から自動的に「タイル」を合成して構築され、スンブル翻訳フレームワークが生成される。
このアプローチは決定論的であり、信頼されたコードベースで実行時コンポーネントを持たない完全で自己完結したバイナリを生成する。
主なコストはコードサイズの拡大である。
主な利点は、アウトプットが実行される実際のコードであり、デプロイ前にテスト、検証、認証、暗号化署名を可能にし、エミュレータやJITコンパイラと比較してリスクを低減することである。
我々は,SPECint 2006 スイート全体を含む実世界のバイナリの多種多様なコーパス上で Elevator を評価し,静的なフルプログラムバイナリ翻訳が信頼性と実用性の両方を実証した。
ElevatorはQEMUのユーザモードJITエミュレーションと同等以上のパフォーマンスを実現している。
関連論文リスト
- PCodeTrans: Translate Decompiled Pseudocode to Compilable and Executable Equivalent [8.576619291429969]
PCodeTransは、逆コンパイル、再コンパイル、厳密な関数レベルの動的検証のギャップを埋める。
99.55%と99.89%のテスト検証された動作一貫性とともに、ストリップされていないバイナリ上で100%の関数レベルのコンパイルが可能となる。
論文 参考訳(メタデータ) (2026-03-16T05:54:24Z) - Verifiable Provenance of Software Artifacts with Zero-Knowledge Compilation [5.939983212292006]
ゼロ知識仮想マシン(zkVM)を用いたソフトウェアをコンパイルし,検証可能な証明手法を提案する。
コンパイラをzkVM内で実行することにより,コンパイルされた出力と暗号証明の両方を生成し,そのコンパイルがクレームコンパイラでクレームされたソースコード上で実行されたことを実証する。
この結果から,zkコンパイルは実世界のソフトウェアに適用可能であり,強力なセキュリティ保証を提供することがわかった。
論文 参考訳(メタデータ) (2026-02-12T12:36:36Z) - SALT4Decompile: Inferring Source-level Abstract Logic Tree for LLM-Based Binary Decompilation [17.58664677898224]
Saltmはバイナリとソースコードの間の安定した論理的特徴を抽象化する新しいバイナリ逆コンパイル法である。
Saltmはソースコードのロジックを回復するのに非常に効果的で、最先端のメソッドよりもはるかに優れている。
論文 参考訳(メタデータ) (2025-09-18T05:57:15Z) - IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。
この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。
バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文 参考訳(メタデータ) (2025-06-24T13:42:59Z) - ExeCoder: Empowering Large Language Models with Executability Representation for Code Translation [57.604506522287814]
既存の大きな言語モデル(LLM)は、事前トレーニング中にのみコードのコンテキスト意味を学習する。
機能的セマンティクスや構文構造,変数依存性といった実行可能性表現を活用するために,ExeCoderを提案する。
ExeCoderは、既存のオープンソースコードLLMを10.88%以上、38.78%以上、27.44%以上、42.97%以上という、2つのメトリクスで、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-01-30T16:18:52Z) - AlphaTrans: A Neuro-Symbolic Compositional Approach for Repository-Level Code Translation and Validation [5.269923665485903]
リポジトリレベルのコード翻訳を自動化するニューロシンボリックアプローチであるAlphaTransを提案する。
AlphaTransを利用して,836,8575,2719>クラス,メソッド,テストからなる10の実世界のオープンソースプロジェクトを翻訳しました。
論文 参考訳(メタデータ) (2024-10-31T16:46:52Z) - Program Translation via Code Distillation [20.668229308907495]
伝統的な機械翻訳は、教師あり翻訳に並列コーパスに依存している。
最近の教師なしニューラルネットワーク翻訳技術は、データ制限を克服している。
コード蒸留(CoDist)と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2023-10-17T04:59:15Z) - Guess & Sketch: Language Model Guided Transpilation [59.02147255276078]
学習されたトランスパイレーションは、手作業による書き直しやエンジニアリングの取り組みに代わるものだ。
確率的ニューラルネットワークモデル(LM)は、入力毎に可塑性出力を生成するが、正確性を保証するコストがかかる。
Guess & Sketch は LM の特徴からアライメントと信頼性情報を抽出し、意味的等価性を解決するためにシンボリック・ソルバに渡す。
論文 参考訳(メタデータ) (2023-09-25T15:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。