論文の概要: VCAO: Verifier-Centered Agentic Orchestration for Strategic OS Vulnerability Discovery
- arxiv url: http://arxiv.org/abs/2604.08291v1
- Date: Thu, 09 Apr 2026 14:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.958764
- Title: VCAO: Verifier-Centered Agentic Orchestration for Strategic OS Vulnerability Discovery
- Title(参考訳): VCAO: 戦略OS脆弱性発見のための検証済みエージェントオーケストレーション
- Authors: Suyash Mishra,
- Abstract要約: ベイジアン・スタックルバーグ検索ゲームとしてのオペレーティングシステム脆弱性発見の定式化
textscVCAO (textbfVerifier-textbfC enter textbfAgentic textbfOrchestration), 表面マッピング, カーネル内攻撃グラフ構築, ゲーム理論ファイル/機能ランキング, 並列実行エージェント, カスケード検証, 安全管理者を含む6層アーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We formulate operating-system vulnerability discovery as a \emph{repeated Bayesian Stackelberg search game} in which a Large Reasoning Model (LRM) orchestrator allocates analysis budget across kernel files, functions, and attack paths while external verifiers -- static analyzers, fuzzers, and sanitizers -- provide evidence. At each round, the orchestrator selects a target component, an analysis method, and a time budget; observes tool outputs; updates Bayesian beliefs over latent vulnerability states; and re-solves the game to minimize the strategic attacker's expected payoff. We introduce \textsc{VCAO} (\textbf{V}erifier-\textbf{C}entered \textbf{A}gentic \textbf{O}rchestration), a six-layer architecture comprising surface mapping, intra-kernel attack-graph construction, game-theoretic file/function ranking, parallel executor agents, cascaded verification, and a safety governor. Our DOBSS-derived MILP allocates budget optimally across heterogeneous analysis tools under resource constraints, with formal $\tilde{O}(\sqrt{T})$ regret bounds from online Stackelberg learning. Experiments on five Linux kernel subsystems -- replaying 847 historical CVEs and running live discovery on upstream snapshots -- show that \textsc{VCAO} discovers $2.7\times$ more validated vulnerabilities per unit budget than coverage-only fuzzing, $1.9\times$ more than static-analysis-only baselines, and $1.4\times$ more than non-game-theoretic multi-agent pipelines, while reducing false-positive rates reaching human reviewers by 68\%. We release our simulation framework, synthetic attack-graph generator, and evaluation harness as open-source artifacts.
- Abstract(参考訳): 我々は,オペレーティングシステムの脆弱性発見を,Large Reasoning Model(LRM)オーケストレータがカーネルファイル,関数,アタックパスに対して解析予算を割り当て,外部検証器(静的アナライザ,ファジエータ,サニタイザ)が証拠を提供するような,emph{repeated Bayesian Stackelberg search game} として定式化する。
各ラウンドにおいて、オーケストレータは、対象のコンポーネント、分析方法、時間予算を選択し、ツール出力を観察し、潜伏している脆弱性状態に対してベイズ的信念を更新し、戦略的な攻撃者の期待した支払いを最小限に抑えるためにゲームを再解決する。
本稿では, サーフェスマッピング, カーネル内アタックグラフ構築, ゲーム理論ファイル/機能ランキング, 並列エグゼクタエージェント, カスケード検証, 安全管理者を含む6層アーキテクチャについて紹介する。
DOBSSから派生したMILPは、リソース制約の下で不均一な分析ツールに最適に予算を割り当てます。
5つのLinuxカーネルサブシステム(847の歴史的CVEをリプレイし、上流スナップショットでライブディスカバリを実行する)の実験によると、 \textsc{VCAO}は、カバレッジのみのファジングよりもユニット予算当たりの脆弱性を検証する$2.7\times$、静的分析のみのベースラインよりも$1.9\times$、非ゲーム理論のマルチエージェントパイプラインよりも$1.4\times$、ヒューマンレビュアーへの偽陽性率を68\%削減している。
我々は、シミュレーションフレームワーク、合成アタックグラフ生成装置、オープンソースアーティファクトとしての評価ハーネスをリリースする。
関連論文リスト
- Towards Predicting Multi-Vulnerability Attack Chains in Software Supply Chains from Software Bill of Materials Graphs [1.628589561701473]
本稿では,新しいSBOMによるグラフ学習手法を用いて,マルチハザーバビリティアタックチェーンの学習に基づく新たな研究方向を提案する。
これにより、SBOM構造とスキャナ出力を、フラットな脆弱性リストではなく、依存性に制約のあるエビデンスグラフとして扱う。
我々は、コンポーネントが少なくとも1つの既知の脆弱性と関連付けられているかどうかを予測するために、異種グラフ注意ネットワーク(HGAT)を訓練する。
我々は、脆弱性の発見を、文書化されたマルチハザーバビリティチェーンでトレーニングされた軽量Multi-Layer Perceptron(MLP)ニューラルネットワークを用いて、CVE-Pairリンク予測として表している。
論文 参考訳(メタデータ) (2026-04-04T17:29:39Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Synergistic Directed Execution and LLM-Driven Analysis for Zero-Day AI-Generated Malware Detection [0.12891210250935145]
自動マルウェア生成のためのLLMのウェポン化は、従来の検出パラダイムに現実的な脅威をもたらす。
本稿では,エスココール実行とエンフディープ学習に基づく脆弱性分類を組み合わせた,新しいハイブリッド分析フレームワークを提案する。
2,500 LLM合成サンプルからなるベンチマークでは、従来のマルウェアでは98.7%、AIによる脅威では97.5%の精度が達成されている。
論文 参考訳(メタデータ) (2026-03-10T00:25:41Z) - Cloud-OpsBench: A Reproducible Benchmark for Agentic Root Cause Analysis in Cloud Systems [51.2882705779387]
Cloud-OpsBenchは、State Snapshot Paradigmを使用して、クラウドの決定論的デジタルツインを構築する大規模なベンチマークである。
フルスタックにまたがる40の根本原因タイプに452の障害ケースがある。
論文 参考訳(メタデータ) (2026-02-28T05:04:42Z) - ReasAlign: Reasoning Enhanced Safety Alignment against Prompt Injection Attack [52.17935054046577]
本稿では、間接的インジェクション攻撃に対する安全性アライメントを改善するためのモデルレベルのソリューションであるReasAlignを提案する。
ReasAlignには、ユーザクエリの分析、競合する命令の検出、ユーザの意図したタスクの継続性を維持するための構造化された推論ステップが組み込まれている。
論文 参考訳(メタデータ) (2026-01-15T08:23:38Z) - LLM-Powered Detection of Price Manipulation in DeFi [12.59175486585742]
分散ファイナンス(DeFi)のスマートコントラクトは数十億ドルを管理し、エクスプロイトの主要なターゲットとなっている。
価格操作の脆弱性は、しばしばフラッシュローンを通じて発生し、壊滅的な攻撃の類である。
本稿では,静的解析とLarge Language Model(LLM)に基づく推論を組み合わせたハイブリッドフレームワークPMDetectorを提案する。
論文 参考訳(メタデータ) (2025-10-24T09:13:30Z) - DiffuGuard: How Intrinsic Safety is Lost and Found in Diffusion Large Language Models [50.21378052667732]
我々は、ステップ内およびステップ間ダイナミクスという2つの異なる次元にわたるジェイルブレイク攻撃に対して、dLLM脆弱性の詳細な分析を行う。
デュアルステージアプローチによる脆弱性に対処する,トレーニング不要な防御フレームワークであるDiffuGuardを提案する。
論文 参考訳(メタデータ) (2025-09-29T05:17:10Z) - Probabilistically Tightened Linear Relaxation-based Perturbation Analysis for Neural Network Verification [83.25968588249776]
本稿では,LiRPAに基づく手法とサンプリングに基づく手法を組み合わせることで,厳密な中間到達性集合を計算できる新しいフレームワークを提案する。
無視可能な計算オーバーヘッドでは、$textttPT-LiRPA$は推定された到達可能な集合を利用し、ニューラルネットワークの出力の上下線形境界を著しく締め付ける。
論文 参考訳(メタデータ) (2025-07-07T18:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。