Fugu-MT 論文翻訳(概要): Benchmarking Large Language Models for IoC Recovery under Adversarial Code Obfuscation and Encryption

論文の概要: Benchmarking Large Language Models for IoC Recovery under Adversarial Code Obfuscation and Encryption

arxiv url: http://arxiv.org/abs/2605.06910v1
Date: Thu, 07 May 2026 20:18:17 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-11 19:43:38.600108
Title: Benchmarking Large Language Models for IoC Recovery under Adversarial Code Obfuscation and Encryption
Title（参考訳）: 逆コード難読化と暗号化によるIoC回復のための大規模言語モデルのベンチマーク
Authors: Jaime Morales, Sergio Pastrana, Juan Tapiador,
Abstract要約: 本稿では,逆コード変換におけるシークレット検出のベンチマークを紹介する。我々は,12レベルの難読化と暗号隠蔽を段階的に変換した336プログラムのデータセットを構築した。 LLMは軽量な変換に対して高い成功を収める一方で、暗号ベースの隠蔽は検出性能を著しく低下させる。
参考スコア（独自算出の注目度）: 3.114761483002247
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Software obfuscation and encryption present persistent challenges for program comprehension and security analysis, particularly when adversaries conceal Indicators of Compromise (IoCs) such as IP addresses within source code. While Large Language Models (LLMs) have recently demonstrated remarkable progress in code reasoning and transformation, their resilience against adversarial concealment techniques remains largely uncharted. This paper introduces a systematic benchmark for secret detection under adversarial code transformations, designed to evaluate the capacity of LLMs to recover IoCs embedded in obfuscated and encrypted JavaScript programs. We construct a dataset of 336 programs, progressively transformed through 12 levels of obfuscation and cryptographic concealment (including XOR and AES-256), to emulate realistic threat scenarios. An automated evaluation framework standardizes LLM queries and responses, enabling reproducible, large-scale testing across diverse models. Our results reveal a dichotomy: while LLMs exhibit high success against lightweight transformations such as variable renaming and Base64 encoding, encryption-based concealment severely degrades detection performance. These findings establish encryption as a critical frontier for LLM-driven code analysis and highlight both current limitations and avenues for advancing automated threat intelligence.
Abstract（参考訳）: ソフトウェア難読化と暗号化は、特に敵がソースコード内のIPアドレスなどのIoC(Indicators of Compromise)を隠蔽する場合に、プログラムの理解とセキュリティ分析に永続的な課題をもたらす。大規模言語モデル(LLM)は、最近、コード推論と変換の顕著な進歩を示しているが、敵の隠蔽技術に対するレジリエンスは、ほとんど変化していない。本稿では,難読化および暗号化されたJavaScriptプログラムに埋め込まれたIoCを復元するLLMの能力を評価するために,逆コード変換の下での秘密検出のための体系的ベンチマークを提案する。我々は、現実的な脅威シナリオをエミュレートするために、12レベルの難読化と暗号隠蔽(XORやAES-256を含む)を段階的に変換した336プログラムのデータセットを構築した。自動評価フレームワークは、LLMクエリとレスポンスを標準化し、様々なモデルで再現可能な大規模テストを可能にする。 LLMは可変リネームやBase64エンコーディングといった軽量変換に対して高い成功を収めているが、暗号ベースの隠蔽は検出性能を著しく低下させる。これらの知見は、LLM駆動のコード解析における重要なフロンティアとして暗号化を確立し、自動化された脅威知能を前進させるための現在の制限と方法の両方を強調している。

関連論文リスト

RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文参考訳（メタデータ） (2026-01-30T08:29:01Z)
Can LLMs Recover Program Semantics? A Systematic Evaluation with Symbolic Execution [1.5377279217726239]
難読化は、プログラムの理解、メンテナンス、テスト、脆弱性検出といったソフトウェアエンジニアリングタスクに永続的な課題をもたらす。微調整言語モデルがプログラムを効果的に難読化し、分析可能性を取り戻すことができるかどうかを検討する。
論文参考訳（メタデータ） (2025-11-24T13:55:20Z)
JsDeObsBench: Measuring and Benchmarking LLMs for JavaScript Deobfuscation [34.88009582470047]
大規模言語モデル(LLM)は、最近、難読化プロセスを自動化することを約束している。 JsDeObsBench は JS の難読化の文脈において LLM の有効性を厳格に評価するために設計されたベンチマークである。
論文参考訳（メタデータ） (2025-06-25T06:50:13Z)
Decompiling Smart Contracts with a Large Language Model [51.49197239479266]
Etherscanの78,047,845のスマートコントラクトがデプロイされているにも関わらず(2025年5月26日現在)、わずか767,520 (1%)がオープンソースである。この不透明さは、オンチェーンスマートコントラクトバイトコードの自動意味解析を必要とする。バイトコードを可読でセマンティックに忠実なSolidityコードに変換する,先駆的な逆コンパイルパイプラインを導入する。
論文参考訳（メタデータ） (2025-06-24T13:42:59Z)
Benchmarking Large Language Models for Cryptanalysis and Side-Channel Vulnerabilities [12.669087812857533]
我々は,現在最先端の大規模言語モデル (LLM) の暗号文上での暗号解析の可能性を評価する。ゼロショットと少数ショット設定を用いて、LLMの復号化成功率を評価し、その理解能力について議論する。本研究は, LLMの強みと, サイドチャネルシナリオにおける限界に関する重要な知見を明らかにするとともに, 過度に一般化した攻撃に対する感受性に関する懸念を提起する。
論文参考訳（メタデータ） (2025-05-30T14:12:07Z)
The Code Barrier: What LLMs Actually Understand? [7.407441962359689]
本研究では,言語モデルの意味理解能力を評価するために,コード難読化を構造化テストフレームワークとして利用する。難読化の複雑さが増加するにつれて、統計的に顕著な性能低下が見られる。本研究では,言語モデルにおけるコード理解を評価するための新しい評価手法を提案する。
論文参考訳（メタデータ） (2025-04-14T14:11:26Z)
ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding [60.37988508851391]
言語モデル(LM)は、コード記述ツールボックスのベースとなっている。 Code-LMの事前学習目標の変更を探求する研究は、データ効率の向上と構文とセマンティクスの相互接続性の向上を目的としており、顕著に不十分である。本研究では,Code-LMが表面的な構文を超越し,事前学習したサンプルの効率を高めるために,難読化コードの基盤について検討する。
論文参考訳（メタデータ） (2025-03-27T23:08:53Z)
TFHE-Coder: Evaluating LLM-agentic Fully Homomorphic Encryption Code Generation [10.597643264309415]
TFHE (Homomorphic Encryption over the Torus) は、復号化せずにデータを暗号化する。マシンラーニングのプライバシ保護、セキュアなマルチパーティ計算、プライベートブロックチェーントランザクション、セキュアな医療診断といった可能性にもかかわらず、暗号化の複雑さとユーザビリティの問題により、その採用は制限されている。この研究は、TFHEコード生成の最初のベンチマークを確立し、ドメイン固有のフィードバックで拡張されたLLMが、FHEコード生成の専門的ギャップを埋める方法を示している。
論文参考訳（メタデータ） (2025-03-15T17:57:44Z)
ShadowCode: Towards (Automatic) External Prompt Injection Attack against Code LLMs [56.46702494338318]
本稿では,コード指向の大規模言語モデルに対する(自動)外部プロンプトインジェクションという,新たな攻撃パラダイムを紹介する。コードシミュレーションに基づいて誘導摂動を自動生成する,シンプルで効果的な方法であるShadowCodeを提案する。 3つの人気のあるプログラミング言語にまたがる31の脅威ケースを発生させるため、13の異なる悪意のある目標に対して本手法を評価した。
論文参考訳（メタデータ） (2024-07-12T10:59:32Z)
Decoding at the Speed of Thought: Harnessing Parallel Decoding of Lexical Units for LLMs [57.27982780697922]
大規模言語モデルは、自然言語の理解と生成において例外的な能力を示した。しかし、それらの生成速度は、その復号過程の本質的にシーケンシャルな性質によって制限される。本稿では,データ駆動方式で実装された新しいデコーディング手法であるLexical Unit Decodingを紹介する。
論文参考訳（メタデータ） (2024-05-24T04:35:13Z)
CodeChameleon: Personalized Encryption Framework for Jailbreaking Large Language Models [49.60006012946767]
パーソナライズされた暗号化手法に基づく新しいジェイルブレイクフレームワークであるCodeChameleonを提案する。我々は、7つの大規模言語モデルに関する広範な実験を行い、最先端の平均アタック成功率(ASR)を達成する。 GPT-4-1106上で86.6%のASRを実現する。
論文参考訳（メタデータ） (2024-02-26T16:35:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。