論文の概要: Multi-View Decompilation for LLM-Based Malware Classification
- arxiv url: http://arxiv.org/abs/2606.20436v1
- Date: Thu, 18 Jun 2026 16:15:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.978307
- Title: Multi-View Decompilation for LLM-Based Malware Classification
- Title(参考訳): LLMに基づくマルウェア分類のためのマルチビューデコンパイル
- Authors: Bercan Turkmen, Vyas Raina,
- Abstract要約: 我々は、さまざまな脅威行動にまたがる良質なユーティリティと悪意あるプログラムのベンチマークを提供する。
両方の逆コンパイラビューを提供することで、主に悪意のあるサンプルのリコールの増加によって、悪意のあるクラスF1が改善されることがわかった。
- 参考スコア(独自算出の注目度): 2.6107088019301252
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Malware analysts often inspect compiled binaries through decompiled pseudo-C, when source code is unavailable. Recent work suggests that large language models (LLMs) can assist this process by classifying decompiled code as benign or malicious, but existing pipelines typically rely on a single decompiler view. We argue that this assumption is fragile: decompilers are lossy heuristic tools, and different decompilers can expose different artefacts of the same binary. We curate a benchmark of benign utilities and malicious programs spanning a range of threat behaviors. Each sample is compiled and decompiled with both Ghidra and RetDec, yielding matched pseudo-C views. Across a range of LLMs from major model families, we find that providing both decompiler views improves malicious-class F1, mainly by increasing recall on malicious samples. Agreement analyses further show that Ghidra and RetDec make partially different errors, supporting the view that decompiler outputs provide complementary evidence. Our results suggest that multi-decompiler prompting is a simple, training-free way to improve LLM-based malware triage in practical settings.
- Abstract(参考訳): マルウェアアナリストは、ソースコードが利用できない場合、コンパイル済みバイナリをデコンパイルされた擬似Cで検査することが多い。
最近の研究は、大規模な言語モデル(LLM)が、コンパイルされたコードを良性または悪意のあるものとして分類することで、このプロセスを支援することを示唆しているが、既存のパイプラインは通常、単一のデコンパイラビューに依存している。
逆コンパイラは失われたヒューリスティックなツールであり、異なる逆コンパイラは同じバイナリの異なるアーチファクトを公開することができる。
我々は、さまざまな脅威行動にまたがる良質なユーティリティと悪意あるプログラムのベンチマークをキュレートする。
各サンプルはGhidraとRetDecの両方でコンパイルおよび逆コンパイルされ、一致した擬似Cビューが生成される。
主要なモデルファミリからの LLM の範囲内で、両方の逆コンパイラビューを提供することで、主に悪意のあるサンプルのリコールの増加によって、悪意のあるクラス F1 が改善されることがわかった。
合意分析はさらに、GhidraとRetDecが部分的に異なるエラーを犯していることを示し、デコンパイラの出力が補完的な証拠を提供するという見解を支持している。
この結果から,マルチデコンパイラのプロンプトは,LCMベースのマルウェアトリアージを実践的に改善するための,シンプルかつトレーニング不要な方法であることが示唆された。
関連論文リスト
- Binary Decompilation LLM with Feedback-Driven Multi-Turn Refinement [39.339662640253785]
本稿では、フィードバック駆動型マルチターンバイナリ逆コンパイルのための強化学習で訓練された逆コンパイル特化LDMであるAutoDecompilerを提案する。
コード妥当性、再コンパイル可能性、実行一貫性、セマンティック忠実性をキャプチャする、逆コンパイル固有の報酬を設計する。
AutoDecompilerファミリをトレーニングし、異なる入力設定、モデルスケール、ベンチマークで評価します。
論文 参考訳(メタデータ) (2026-06-15T03:25:05Z) - SCDBench: A Benchmark for LLM-Based Smart Contract Decompilers [55.39407031861402]
本稿では,スマートコントラクトデコンパイルのためのデータセットとベンチマーク手法であるSCDBenchを紹介する。
データセットには600の現実のSolidityコントラクトと、ペア化されたバイトコード入力、地味なソースコード、再生可能なセマンティックチェックポイントが含まれている。
我々は,GLM-5の変種を含むゼロショット逆コンパイル設定において,Claude Opus 4.7,GPT-5.3-Codex,GLM-5を評価した。
論文 参考訳(メタデータ) (2026-05-27T20:08:47Z) - Constraint-Guided Multi-Agent Decompilation for Executable Binary Recovery [47.704311990064554]
脱コンパイルは、セキュリティ分析、マルウェアのリバースエンジニアリング、レガシーソフトウェアメンテナンスに不可欠である。
マルチレベル制約誘導型デコンパイル(MCGD)により,デコンパイルされたコードを再実行可能なソースに変換するマルチエージェントフレームワークを提案する。
本フレームワークは,84~97%の再実行性を実現し,28~89ポイントのベースラインデコンパイラ出力を改善した。
論文 参考訳(メタデータ) (2026-04-27T01:28:11Z) - Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - D-LiFT: Improving LLM-based Decompiler Backend via Code Quality-driven Fine-tuning [49.16469288280772]
逆コンパイラは、バイナリから可読なソースコードを再構築する。
近年の進歩にもかかわらず、そのアウトプットは構文上の誤りや意味的な誤りに悩まされ、読みにくいままである。
大規模言語モデル (LLMs) の出現により、研究者は逆コンパイラ出力を洗練するためのLLMの可能性を探り始めた。
D-LIFTは、微調整強化学習を施した拡張逆コンパイラLLMパイプラインである。
論文 参考訳(メタデータ) (2025-06-11T19:09:08Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - Refining Decompiled C Code with Large Language Models [15.76430362775126]
Cデコンパイラは、実行可能ファイルをソースコードに変換する。
一度再コンパイルされたC言語のソースコードは、元の実行ファイルと同じ機能を持つ実行ファイルを生成することが期待されている。
論文 参考訳(メタデータ) (2023-10-10T11:22:30Z) - Improving type information inferred by decompilers with supervised
machine learning [0.0]
ソフトウェアリバースエンジニアリングでは、逆コンパイルはバイナリファイルからソースコードを回復するプロセスである。
関数によって返される高レベルな型を推測できる異なる分類モデルを構築する。
私たちのシステムは、79.1%のF1測定で関数戻り型を予測できますが、最良の逆コンパイラは30%のF1測定を得ます。
論文 参考訳(メタデータ) (2021-01-19T11:45:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。