論文の概要: The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code
- arxiv url: http://arxiv.org/abs/2605.03619v1
- Date: Tue, 05 May 2026 10:44:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.900692
- Title: The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code
- Title(参考訳): 無限変異エンジン : LLM生成攻撃コードにおける多型の測定
- Authors: Gabriel Hortea, Juan Tapiador,
- Abstract要約: 商用モデルの多型容量を自動マルウェア発生器として測定する。
機能要件のみを規定するプロンプトと、事前結果の構造的履歴を注入して分散を強制するプロンプトの2つの設定でペイロードを生成します。
- 参考スコア(独自算出の注目度): 0.6359663723794672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Malware authors have traditionally relied on polymorphic techniques to produce variants in the same malware family, complicating signature-based detection. Integrating generative AI into offensive toolchains enables attackers to synthesize structurally diverse payloads with identical behavior, raising the question of how much polymorphism LLMs provide. Recent work has assumed that LLMs can produce sufficiently polymorphic payloads, leaving unquantified the variation that emerges when an attacker repeatedly builds the same payload, or explicitly instructs the model to avoid prior implementations. In this work, we measure the polymorphic capacity of a commercial model (Claude Opus 4.6) as an automated malware generator. We build a dual-agent, four-stage pipeline that generates, tests, and refines a data-exfiltration payload comprising file traversal, encryption, exfiltration, and integration. We produce payloads in two settings: using prompts that specify only functional requirements, and using prompts that inject a structured history of prior outcomes to force divergence. We measure pairwise distances along structural (AST) and semantic (embedding) axes, finding that when polymorphism is not explicitly required, structural distances are high while semantic distances remain low; i.e., implementations diverge widely without changing high-level behavior. Explicit prompting substantially amplifies this structural diversity while preserving correctness, at the cost of roughly 5 times more tokens but only a small increase in LLM calls (from $4.2$ to $4.5$ per payload, with effective API costs of \$0.41 and \$0.73). These results show that a single commercial LLM can cheaply generate large populations of behaviorally equivalent yet structurally diverse payloads, facilitating the evasion of signature-based detection rules and similarity-based clustering.
- Abstract(参考訳): マルウェアの作者は伝統的に、署名に基づく検出を複雑にし、同じマルウェアファミリーで変種を生成するために多型技術に依存してきた。
生成AIを攻撃ツールチェーンに統合することで、攻撃者は構造的に多様なペイロードを同一の振る舞いで合成することができる。
最近の研究は、LLMが十分な多型ペイロードを生成できると仮定しており、攻撃者が同じペイロードを何度もビルドしたり、あるいは以前の実装を避けるよう明示的にモデルに指示したりするときに発生する変動を、未定のまま残している。
本研究では,商用モデルの多型容量(Claude Opus 4.6)を自動マルウェア生成器として測定する。
我々は、ファイルトラバーサル、暗号化、消去、統合を含むデータ抽出ペイロードを生成し、テストし、洗練する、二重エージェントの4段階パイプラインを構築します。
機能要件のみを規定するプロンプトと、事前結果の構造的履歴を注入して分散を強制するプロンプトの2つの設定でペイロードを生成します。
構造的(AST)と意味的(埋め込み)軸に沿ったペアワイズ距離を測定し、多型が明示的に要求されない場合、構造的距離は高く、意味的距離は低い。
明示的なプロンプトは、この構造的多様性を著しく増幅し、正確さを保ちながら、トークンの約5倍のコストで、LCM呼び出しの増加はわずかである(ペイロードあたり4.2ドルから4.5ドル、効果的なAPIコストは0.41ドルと0.73ドル)。
これらの結果から,単一商用LCMは,動作に等価だが構造的に多様なペイロードを安価に生成し,シグネチャベースの検出ルールや類似性に基づくクラスタリングを回避できることが示唆された。
関連論文リスト
- ProjLens: Unveiling the Role of Projectors in Multimodal Model Safety [54.4092272526747]
MLLM(Multimodal Large Language Models)は、クロスモーダルな理解と生成において大きな成功を収めていますが、そのデプロイは重大な安全性の脆弱性によって脅かされています。
本稿では,MLLMのバックドアを復号化するための解釈可能性フレームワークであるProjLensを提案する。
論文 参考訳(メタデータ) (2026-04-21T04:52:38Z) - Sparse Semantic Dimension as a Generalization Certificate for LLMs [53.681678236115836]
Sparse Semantic Dimension (SSD)は,モデル層上で訓練されたSparse Autoencoder (SAE)のアクティブな特徴語彙から導かれる複雑性尺度である。
我々はGPT-2 Small と Gemma-2B でこの枠組みを検証し、実際のサンプルサイズで非空き証明書を提供することを実証した。
論文 参考訳(メタデータ) (2026-02-11T21:45:18Z) - The Trojan in the Vocabulary: Stealthy Sabotage of LLM Composition [31.827344197678126]
トケナイザー移植はサプライチェーンの脆弱性を導入する。
係数再利用の幾何学を利用して、我々の攻撃は非対称的な実現可能性ギャップを生み出す。
実験的に、攻撃は訓練なしで、スペクトルの模倣を達成し、異常検出を回避する。
論文 参考訳(メタデータ) (2025-12-31T19:00:03Z) - AlignTree: Efficient Defense Against LLM Jailbreak Attacks [48.805151796878505]
大規模言語モデル(LLM)は、安全ガイドラインをバイパスし有害なコンテンツを生成する敵攻撃に対して脆弱である。
最小限の計算オーバーヘッドを維持しながらモデルアライメントを向上させるAlignTreeディフェンスを導入する。
論文 参考訳(メタデータ) (2025-11-15T13:42:22Z) - Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.09559830840595]
本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文 参考訳(メタデータ) (2025-08-20T17:59:51Z) - MOSAIC: Multiple Observers Spotting AI Content [35.67613230687864]
大規模言語モデル(LLM)は大規模に訓練され、強力なテキスト生成能力を備えている。
本研究では,人文テキストから人工的に生成したテキストを自動的に識別する手法を提案する。
種々のジェネレータLSMを用いて実験を行った結果,本手法は各モデルの強度を効果的に活用できることが示唆された。
論文 参考訳(メタデータ) (2024-09-11T20:55:12Z) - ReEval: Automatic Hallucination Evaluation for Retrieval-Augmented Large Language Models via Transferable Adversarial Attacks [91.55895047448249]
本稿では,LLMベースのフレームワークであるReEvalについて述べる。
本稿では、ChatGPTを用いてReEvalを実装し、2つの人気のあるオープンドメインQAデータセットのバリエーションを評価する。
我々の生成したデータは人間可読であり、大きな言語モデルで幻覚を引き起こすのに役立ちます。
論文 参考訳(メタデータ) (2023-10-19T06:37:32Z) - Multi-objective Evolutionary Search of Variable-length Composite
Semantic Perturbations [1.9100854225243937]
可変長複合意味摂動(MES-VCSP)の多目的進化探索法を提案する。
MES-VCSPは、高い攻撃成功率、より自然性、より少ない時間コストで敵の例を得ることができる。
論文 参考訳(メタデータ) (2023-07-13T04:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。