論文の概要: uGen: An Agentic Framework for Generating Microarchitectural Attack PoCs
- arxiv url: http://arxiv.org/abs/2605.15503v1
- Date: Fri, 15 May 2026 00:50:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.288383
- Title: uGen: An Agentic Framework for Generating Microarchitectural Attack PoCs
- Title(参考訳): uGen: マイクロアーキテクチャアタックPoCの生成のためのエージェントフレームワーク
- Authors: Debopriya Roy Dipta, Thore Tiemann, Eduard Marin, Thomas Eisenbarth, Berk Gulmezoglu,
- Abstract要約: 自動マイクロアーキテクチャアタックコード生成のための最初のフレームワークであるuGenを紹介する。
重要な課題は、大規模言語モデルにおける攻撃固有の知識ギャップを特定することである。
uGenはSpectre-v1で100%の成功率、Prime+Probeで80%に達する。
- 参考スコア(独自算出の注目度): 6.236296593323531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Microarchitectural attacks continue to evolve, uncovering new exploitation vectors in modern processors. From a defensive perspective, assessing a system's susceptibility to such attacks remains challenging. Developing functional attack implementations is labor-intensive, requires deep microarchitectural expertise, and is highly sensitive to execution environments. Consequently, existing attacks often lack portability, limiting systematic and scalable vulnerability assessment. Recent advances in large language models (LLMs) suggest a potential avenue for lowering these barriers. However, it remains unclear whether LLMs can reliably generate functionally correct microarchitectural attack code suitable for rigorous vulnerability testing. In this work, we present uGen, the first LLM-driven framework for automated microarchitectural attack code generation. A key challenge we address is identifying attack-specific knowledge gaps in LLMs. Through a systematic study of state-of-the-art models (GPT, Claude, and Qwen3), we find that LLMs frequently misgenerate or misplace critical attack primitives. Guided by this analysis, uGen employs a retrieval-augmented, multi-agent design that injects missing domain knowledge to synthesize functionally correct microarchitectural attack PoCs tailored to defender requirements. We evaluate uGen on cache-based and speculative-execution attacks across diverse set of microarchitectures, vulnerable functions, and LLM platforms. In the deployment stage, uGen achieves up to 100% success rate for Spectre-v1 (Claude Sonnet-4) and 80% for Prime+Probe (Qwen3-Coder). Finally, we demonstrate that uGen can generate a successful PoC code with a cost of $1.25 in under four minutes.
- Abstract(参考訳): マイクロアーキテクチャーアタックは進化を続け、現代のプロセッサで新たなエクスプロイトベクターが発見されている。
防衛の観点からは、そのような攻撃に対するシステムの感受性を評価することは依然として困難である。
機能的なアタック実装の開発は労働集約的であり、詳細なマイクロアーキテクチャの専門知識を必要とし、実行環境に非常に敏感である。
その結果、既存の攻撃はポータビリティを欠くことが多く、体系的でスケーラブルな脆弱性評価を制限している。
大規模言語モデル(LLM)の最近の進歩は、これらの障壁を下げるための潜在的な道のりを示唆している。
しかし、LSMが厳密な脆弱性テストに適した機能的に正しいマイクロアーキテクチャ攻撃コードを確実に生成できるかどうかは不明である。
そこで本研究では,LLMによる自動マイクロアーキテクチャアタックコード生成のための,最初のフレームワークであるuGenを紹介する。
私たちが取り組む重要な課題は、LLMにおける攻撃固有の知識ギャップを特定することです。
最先端モデル (GPT, Claude, Qwen3) の体系的な研究により, LLM がしばしば重要な攻撃プリミティブを誤生成または誤配置していることが判明した。
この分析によって導かれたuGenは、ドメイン知識の欠如を注入して、ディフェンダー要件に合わせた機能的に正しいマイクロアーキテクチャアタックPoCを合成する、検索拡張されたマルチエージェント設計を採用している。
我々は,様々なマイクロアーキテクチャ,脆弱性関数,LLMプラットフォームを対象とした,キャッシュベースおよび投機的実行攻撃に基づくuGenの評価を行った。
デプロイ段階では、uGenはSpectre-v1(Claude Sonnet-4)で100%の成功率、Prime+Probe(Qwen3-Coder)で80%に達する。
最後に、uGenが4分以内で1.25ドルで成功したPoCコードを生成することを実証する。
関連論文リスト
- ProjLens: Unveiling the Role of Projectors in Multimodal Model Safety [54.4092272526747]
MLLM(Multimodal Large Language Models)は、クロスモーダルな理解と生成において大きな成功を収めていますが、そのデプロイは重大な安全性の脆弱性によって脅かされています。
本稿では,MLLMのバックドアを復号化するための解釈可能性フレームワークであるProjLensを提案する。
論文 参考訳(メタデータ) (2026-04-21T04:52:38Z) - Invisible Threats from Model Context Protocol: Generating Stealthy Injection Payload via Tree-based Adaptive Search [19.570062155058135]
モデルコンテキストプロトコル(MCP)の最近の進歩により、大きな言語モデル(LLM)が前例のない簡単さで外部ツールを呼び出せるようになった。
これにより、強力なツール強化エージェントの新しいクラスが生成される。
MCPを標的とする間接的インジェクションの既存の技術は、高いデプロイメントコスト、弱いセマンティックコヒーレンス、重いホワイトボックス要求に悩まされている。
我々は,防衛下においてもMPP対応エージェントの制御を確実に抑えるために,自然なペイロードを生成する新しいブラックボックス攻撃であるTree Structured Injection for Payloads (TIP)を提案する。
論文 参考訳(メタデータ) (2026-03-25T11:24:47Z) - AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.751251342738225]
大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。
それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。
近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。
本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文 参考訳(メタデータ) (2025-04-10T13:09:50Z) - ELBA-Bench: An Efficient Learning Backdoor Attacks Benchmark for Large Language Models [55.93380086403591]
生成可能な大規模言語モデルは、バックドアアタックに対して脆弱である。
$textitELBA-Bench$は、パラメータを効率的に微調整することで攻撃者がバックドアを注入できるようにする。
$textitELBA-Bench$は1300以上の実験を提供する。
論文 参考訳(メタデータ) (2025-02-22T12:55:28Z) - LLM-Virus: Evolutionary Jailbreak Attack on Large Language Models [59.29840790102413]
既存のジェイルブレイク攻撃は主に不透明な最適化手法と勾配探索法に基づいている。
進化的ジェイルブレイクと呼ばれる進化的アルゴリズムに基づくジェイルブレイク攻撃手法であるLSM-Virusを提案する。
この結果から, LLM-Virus は既存の攻撃手法と比較して, 競争力や性能に優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-12-28T07:48:57Z) - ShadowCode: Towards (Automatic) External Prompt Injection Attack against Code LLMs [56.46702494338318]
本稿では,コード指向の大規模言語モデルに対する(自動)外部プロンプトインジェクションという,新たな攻撃パラダイムを紹介する。
コードシミュレーションに基づいて誘導摂動を自動生成する,シンプルで効果的な方法であるShadowCodeを提案する。
3つの人気のあるプログラミング言語にまたがる31の脅威ケースを発生させるため、13の異なる悪意のある目標に対して本手法を評価した。
論文 参考訳(メタデータ) (2024-07-12T10:59:32Z) - CleanGen: Mitigating Backdoor Attacks for Generation Tasks in Large Language Models [2.852785344249702]
我々は,大規模言語モデルにおける生成タスクに対するバックドアアタックを軽減するために,CLEANGENという新しい推論時間ディフェンスを開発した。
CLEANGENは最先端のSOTA (State-of-the-art) LLMと互換性がある。
以上の結果から,CLEANGENは5つのSOTAベースライン防御よりも攻撃成功率(ASR)が低いことが示唆された。
論文 参考訳(メタデータ) (2024-06-18T04:10:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。