論文の概要: Decaf: Improving Neural Decompilation with Automatic Feedback and Search
- arxiv url: http://arxiv.org/abs/2605.11501v1
- Date: Tue, 12 May 2026 04:21:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.571558
- Title: Decaf: Improving Neural Decompilation with Automatic Feedback and Search
- Title(参考訳): Deaf: 自動フィードバックと検索によるニューラルデコンパイルの改善
- Authors: Alexander Shypula, Osbert Bastani, Edward Schwartz,
- Abstract要約: 高レベルな構文、識別子、カスタムデータ型は一般的に失われ、コンパイラは人間可読なコードを低レベルなマシンコードに変換する。
生成AIモデルは、ハイレベルな構文、識別子、型を再構築するのに自然なものだ。
コンパイラフィードバックは,サーチによるニューラルデコンパイラ出力のセマンティックな正当性の向上に有効である,と我々は主張する。
- 参考スコア(独自算出の注目度): 64.02615739798277
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decompilers are useful tools used in reverse engineering to understand compiled source code. Reconstructing source code from compiled binaries is a challenging task, because high-level syntax, identifiers, and custom data types are generally lost as the compiler translates human-readable code to low-level machine code. Deterministic decompilers are useful tools for binary analysis, but can struggle to infer idiomatic syntax and identifier names. Generative AI models are a natural fit for reconstructing high-level syntax, identifiers, and types, but they can still suffer by hallucinating improper programming constructs and semantics. Instead of attempting to improve neural decompilers with more data and more training, we argue that compiler feedback can be used to dramatically improve the semantic correctness of neural decompiler outputs via search. Our system, Decaf (DECompilation with Automated Feedback), raises the neural decompilation rate from 26.0% on ExeBench to 83.9% on the Real -O2 split without sacrificing similarity to the original source code. We also find our automatic feedback methodology is highly effective for improving weaker neural decompilation models.
- Abstract(参考訳): 逆エンジニアリングにおいて、デコンパイラはコンパイルされたソースコードを理解するのに有用なツールである。
コンパイルされたバイナリからソースコードを再構築することは難しい作業である。高いレベルの構文、識別子、カスタムデータ型は一般的に失われる。
決定論的デコンパイラはバイナリ解析に有用なツールであるが、慣用的な構文や識別子の名前の推測に苦労する可能性がある。
生成AIモデルは、ハイレベルな構文、識別子、型を再構築するのに自然に適しているが、それでも不適切なプログラミング構成やセマンティクスを幻覚させることで苦しむことができる。
より多くのデータとより多くのトレーニングでニューラルデコンパイラを改善するのではなく、コンパイラフィードバックは、サーチによるニューラルデコンパイラ出力のセマンティックな正しさを劇的に改善するために使用できる、と私たちは主張する。
我々のシステムであるDecaf(DECompilation with Automated Feedback)は、ExeBenchで26.0%からReal-O2スプリットで83.9%まで、元のソースコードと類似性を犠牲にすることなく、ニューラルデコンパイル率を高める。
また、我々の自動フィードバック手法は、より弱い神経脱コンパイルモデルを改善するのに非常に効果的であることもわかりました。
関連論文リスト
- Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - Idioms: Neural Decompilation With Joint Code and Type Definition Prediction [7.421408987075001]
既存の神経脱コンパイルベンチマークよりもはるかに複雑で現実的な型を含む新しいデータセットであるRealtypeを紹介します。
提案手法は, ニューラルデコンパイルにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2025-02-06T22:13:40Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Boosting Neural Networks to Decompile Optimized Binaries [13.255618541522436]
Decompilation は低レベルプログラム言語 (LPL) を機能的に等価な高レベルプログラム言語 (HPL) に変換することを目的としている。
本稿では,コンパイラ最適化バイナリをターゲットとしたNeurDPという新しい学習手法を提案する。
論文 参考訳(メタデータ) (2023-01-03T06:45:54Z) - Beyond the C: Retargetable Decompilation using Neural Machine
Translation [5.734661402742406]
我々は,新しい言語に容易に再ターゲティング可能なプロトタイプ・デコンパイラを開発した。
トークン化やトレーニングデータ選択などのパラメータが逆コンパイルの品質に与える影響について検討する。
トレーニングデータ、トレーニングされた逆コンパイルモデル、そして将来の言語に依存しない逆コンパイルの研究を促進するためのコードをリリースします。
論文 参考訳(メタデータ) (2022-12-17T20:45:59Z) - Improving type information inferred by decompilers with supervised
machine learning [0.0]
ソフトウェアリバースエンジニアリングでは、逆コンパイルはバイナリファイルからソースコードを回復するプロセスである。
関数によって返される高レベルな型を推測できる異なる分類モデルを構築する。
私たちのシステムは、79.1%のF1測定で関数戻り型を予測できますが、最良の逆コンパイラは30%のF1測定を得ます。
論文 参考訳(メタデータ) (2021-01-19T11:45:46Z) - Contrastive Code Representation Learning [95.86686147053958]
一般的な再構成に基づくBERTモデルは,ソースコードの編集に敏感であることを示す。
コントラコード(ContraCode)は、コード機能を学ぶのにフォームではなく、コントラスト的な事前学習タスクである。
論文 参考訳(メタデータ) (2020-07-09T17:59:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。