論文の概要: Root-Cause-Driven Automated Vulnerability Repair
- arxiv url: http://arxiv.org/abs/2605.04251v1
- Date: Tue, 05 May 2026 19:34:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.51736
- Title: Root-Cause-Driven Automated Vulnerability Repair
- Title(参考訳): 根管駆動型自動脆弱性修復
- Authors: Hulin Wang, Zion Leonahenahe Basque, Jie Hu, Ati Priya Bajaj, Yibo Liu, Samuel Zhu, Giorgi Kobakhia, Nikhil Chapre, Will Rosenberg, Siddharth Mishra, Aditya Maheshbhai Gabani, Moritz Schloegel, Adam Doupé, Yan Shoshitaishvili, Ruoyu Wang, Tiffany Bao,
- Abstract要約: Kumushiは、欠陥に最も関係のあるコードに焦点を当てた、ルート原因駆動のパッチエージェントである。
根本原因の修正を増やし、表面パッチを少なくし、決定的なペア比較の多数で好まれる。
- 参考スコア(独自算出の注目度): 22.901308199259443
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent LLM-based systems have made automated vulnerability repair increasingly practical, but two challenges remain. First, without strong signals about where a bug originates, repair agents drift toward shallow edits that silence the observed failure while leaving the underlying defect unresolved. Second, finding the root cause for bugs is hard: even developers familiar with the codebase frequently produce fixes that address symptoms rather than the root cause, and LLM-based agents, operating with noisier context and less program understanding, are no exception. We present Kumushi, a root-cause-driven patching agent that addresses both challenges by combining diversified dynamic fault localization with evidence-weighted ranking to focus the LLM on the code most relevant to the defect. To rigorously measure whether Kumushi produces genuinely better patches, we also introduce a two-tier patch quality metric that pairs automated oracle validation with structured expert assessment of patches. Evaluated on 178 C/C++ vulnerabilities, Kumushi substantially outperforms prior specialized repair agents under automated evaluation while matching a frontier commercial coding agent. Expert assessment then reveals differences that oracles cannot: Kumushi produces more root-cause fixes and fewer superficial patches, and is preferred in the majority of decisive pairwise comparisons. Together, these results demonstrate that progress in automated vulnerability repair requires not only stronger patching systems, but also richer evaluation methods capable of distinguishing genuine fixes from oracle-passing ones.
- Abstract(参考訳): 最近のLSMベースのシステムでは、自動脆弱性修復がますます実用的になっているが、2つの課題が残っている。
まず、バグの発端に関する強いシグナルがなければ、修復作業員は浅い編集に向かって漂流し、観察された障害を沈黙させ、根底にある欠陥を未解決のままにしておく。
第2に、バグの根本原因を見つけることは難しい — コードベースに精通している開発者でさえ、根本原因よりも症状に対処する修正を頻繁に生成している。
欠陥に最も関係のあるコードにLLMを集中させるために,多様な動的障害局所化とエビデンス重み付けランキングを組み合わせることで,両課題に対処する根本原因対応パッチエージェントであるKumushiを紹介する。
クムシが真に優れたパッチを生成するかどうかを厳格に評価するために、自動オラクル検証とパッチの構造化専門家評価を組み合わせた2層パッチ品質指標も導入する。
クムシは178のC/C++脆弱性に基づいて評価され、フロンティアの商用コーディングエージェントとマッチングしながら、自動評価の下で、事前の特別な修復エージェントよりも大幅にパフォーマンスが向上した。
クムシは根本原因の修正を増やし、表面パッチを少なくし、決定的なペアワイズ比較の大部分で好まれる。
これらの結果から, 自動脆弱性修復の進展は, より強力なパッチシステムを必要とするだけでなく, 本物の修正をオラクル経由の修正と区別できる, よりリッチな評価方法を必要とすることが示唆された。
関連論文リスト
- Beyond Fixed Tests: Repository-Level Issue Resolution as Coevolution of Code and Behavioral Constraints [17.818522356206977]
ほとんどの大規模言語モデル(LLM)ベースの修復システムは、修理中に固定された動作制約を扱います。
本稿では,Agent-CoEvoを提案する。Agent-CoEvoは共進化的マルチエージェントフレームワークで,候補コードパッチとテストパッチを共同で探索し,洗練する。
Agent-CoEvoは、修復の成功と再現性の両方において、最先端のエージェントベースとエージェントレスベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-04-06T10:26:46Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。
kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。
kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文 参考訳(メタデータ) (2026-02-02T19:06:15Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.17681731375364]
SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文 参考訳(メタデータ) (2025-10-01T15:09:27Z) - What Do They Fix? LLM-Aided Categorization of Security Patches for Critical Memory Bugs [46.325755802511026]
我々は、LLM(Large Language Model)と細調整された小言語モデルに基づく2つのアプローチを統合するデュアルメタルパイプラインであるLMを開発した。
LMは、OOBまたはUAFの脆弱性に対処する最近のLinuxカーネルのパッチ5,140のうち111つを、手作業による検証によって90の正の正が確認された。
論文 参考訳(メタデータ) (2025-09-26T18:06:36Z) - VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - RePaCA: Leveraging Reasoning Large Language Models for Static Automated Patch Correctness Assessment [0.0]
本稿では,Large Language Models (LLM) を利用した新しい静的APCA手法であるRePaCAを紹介する。
提案手法は,83.1%の精度と84.8%のF1スコアで最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-07-30T11:21:09Z) - An Empirical Study on LLM-based Agents for Automated Bug Fixing [8.660251517380779]
大規模な言語モデル (LLM) と LLM ベースのエージェントが自動的にバグを修正するために適用されている。
自動バグ修正のためのSWE-bench Verifiedベンチマークにおいて,6つの修復システムについて検討した。
論文 参考訳(メタデータ) (2024-11-15T14:19:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。