論文の概要: MemRepair: Hierarchical Memory for Agentic Repository-Level Vulnerability Repair
- arxiv url: http://arxiv.org/abs/2605.17444v1
- Date: Sun, 17 May 2026 13:29:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.091095
- Title: MemRepair: Hierarchical Memory for Agentic Repository-Level Vulnerability Repair
- Title(参考訳): MemRepair: エージェントレポジトリ-レベル脆弱性修復のための階層記憶
- Authors: Simiao Liu, Li Zhang, Fang Liu, Xiaoli Lian, Yang Liu, Yinghao Zhu,
- Abstract要約: 現代のソフトウェアエコシステムは、公表された脆弱性の急増に直面している。
既存のシステムのほとんどは、脆弱性の修復を、現在見えるコードコンテキストの単一生成ステップとして扱う。
本稿では、メモリ拡張されたエージェントフレームワークであるMemRepairを紹介し、脆弱性修復を反復的、経験駆動的なプロセスとして定式化する。
- 参考スコア(独自算出の注目度): 10.709112246848058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern software ecosystems face a rapidly growing number of disclosed vulnerabilities, increasing the need for automated repair techniques that can operate reliably at repository scale. Although Large Language Model (LLM)-based agents have recently shown promise for automated vulnerability repair (AVR), most existing systems still treat repair as a single generation step over the currently visible code context. As a result, they lack a persistent mechanism for reusing prior fixes or learning from failed validation attempts, which limits their effectiveness on complex, multi-file repair tasks. We present MemRepair, a memory-augmented agentic framework that formulates vulnerability repair as an iterative, experience-driven process. MemRepair combines three complementary memory layers, i.e., History-Fix, Security-Pattern, and Refinement-Trajectory memories, with a dynamic feedback-driven refinement loop. This design allows the agent to retrieve repository-specific repair conventions, apply reusable security defenses, and exploit prior "failure-to-success" trajectories to revise semantically invalid patches based on runtime evidence. We evaluate MemRepair on three representative repository-level vulnerability repair benchmarks: SEC-Bench, PatchEval (Python, Go, JavaScript), and the C++ subset of Multi-SWE-bench. MemRepair achieves state-of-the-art resolution rates of 58.0%, 58.2%, and 30.58%, respectively, outperforming strong general-purpose agents such as OpenHands and SWE-agent, as well as the specialized AVR tool InfCode-C++, while maintaining competitive repair cost. These results show that persistent, hierarchical repair memory can substantially improve the reliability of agentic vulnerability repair across diverse languages and repository settings.
- Abstract(参考訳): 現代のソフトウェアエコシステムは、公開する脆弱性の急増に直面しており、リポジトリスケールで確実に動作可能な自動修復技術の必要性が高まっている。
LLM(Large Language Model)ベースのエージェントは最近、自動脆弱性修正(AVR)を約束している。
結果として、修正前の再利用や検証失敗から学ぶための永続的なメカニズムが欠如しており、複雑な複数ファイルの修正タスクにおける有効性を制限している。
本稿では、メモリ拡張されたエージェントフレームワークであるMemRepairを紹介し、脆弱性修復を反復的、経験駆動的なプロセスとして定式化する。
MemRepairは3つの相補的メモリ層、すなわちHistory-Fix、Security-Pattern、Refinement-Trajectoryメモリと動的フィードバック駆動リファインメントループを組み合わせる。
この設計により、エージェントはリポジトリ固有の修復規約を検索し、再利用可能なセキュリティ防御を適用し、以前の"失敗から失敗までの"トラジェクトリを利用して、実行時のエビデンスに基づいてセマンティックに無効なパッチを修正できる。
我々はMemRepairを、SEC-Bench、PatchEval(Python、Go、JavaScript)、Multi-SWE-benchのC++サブセットの3つの代表的なリポジトリレベルの脆弱性修復ベンチマークで評価した。
MemRepairは、それぞれ58.0%、58.2%、および30.58%の最先端の解像度を達成し、OpenHandsやSWE-agentのような強力な汎用エージェント、および特別なAVRツールであるInfCode-C++を上回り、競争力のある修理コストを維持している。
これらの結果から,永続的かつ階層的な修復メモリは,多様な言語やリポジトリ設定におけるエージェント的脆弱性修復の信頼性を大幅に向上することが示された。
関連論文リスト
- ContraFix: Agentic Vulnerability Repair via Differential Runtime Evidence and Skill Reuse [10.503895811137095]
大規模言語モデル(LLM)エージェントは、自動脆弱性修復にますます利用されている。
最近の実証的な結果は、これらのエージェントがいまだに現実世界の脆弱性と戦っていることを示している。
ContraFixは、再利用可能な修復スキルとランタイムエビデンスを結合するエージェントフレームワークである。
論文 参考訳(メタデータ) (2026-05-17T13:48:25Z) - EvidenT: An Evidence-Preserving Framework for Iterative System-Level Package Repair [26.445772656438752]
ツール実行からエビデント管理を分離するエビデント修復フレームワークであるエビデントを提案する。
実世界のRISC-Vパッケージビルド障害219件についてEvidenTの評価を行った。
予備実験はaarch64で41.77%、x86_64で46.99%の成功率を達成した。
論文 参考訳(メタデータ) (2026-05-09T02:29:57Z) - ARES: Adaptive Red-Teaming and End-to-End Repair of Policy-Reward System [70.10833169681239]
ヒトフィードバック(RLHF)からの強化学習は、大規模言語モデル(LLM)の整合の中心である
不完全なリワードモデル(RM)は、安全でない振る舞いをペナルティ化できないと、単一障害点になる可能性がある。
このような二重脆弱性を系統的に発見・緩和するフレームワークであるARESを紹介する。
論文 参考訳(メタデータ) (2026-04-20T19:54:47Z) - QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization [50.722636027998]
大規模言語モデル (LLM) はプログラム修復性能が高いが、しばしば過剰な編集に悩まされる。
オーバー編集を軽減し,修復精度を向上させるフレームワークであるPRepairを提案する。
論文 参考訳(メタデータ) (2026-04-07T14:56:38Z) - FailureMem: A Failure-Aware Multimodal Framework for Autonomous Software Repair [45.42550492783294]
MAPR(Multimodal Automated Program repair)は、ソースコード、テキストのイシュー記述、GUIスクリーンショットなどのビジュアルアーティファクトを共同で推論することを要求することで、従来のプログラム修復を拡張している。
我々は,3つの主要なメカニズムを統合したマルチモーダル修復フレームワークであるFailureMemを提案する。これは,構造的ローカライゼーションとフレキシブルな推論とをバランスさせるハイブリッドワークフローエージェントアーキテクチャ,領域レベルの視覚的接地を可能にするアクティブな認識ツール,過去の修復の試みを再利用可能なガイダンスに変換するFailure Memory Bankである。
論文 参考訳(メタデータ) (2026-03-18T15:24:22Z) - RepoRepair: Leveraging Code Documentation for Repository-Level Automated Program Repair [30.23781155493087]
RepoRepairは,レポジトリレベルの障害ローカライゼーションとプログラム修復のための新しいドキュメンテーションによるアプローチである。
私たちの中核的な洞察は、LLMを活用して、コードリポジトリの階層的なコードドキュメンテーション(関数からファイルまで)を生成することです。
RepoRepairはまず、テキストベースのLLMを使用して、リポジトリのファイル/関数レベルのコードドキュメントを生成する。
論文 参考訳(メタデータ) (2026-03-01T11:06:24Z) - RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.17681731375364]
SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文 参考訳(メタデータ) (2025-10-01T15:09:27Z) - RelRepair: Enhancing Automated Program Repair by Retrieving Relevant Code [11.74568238259256]
RelRepairは関連するプロジェクト固有のコードを取得し、プログラムの自動修復を強化する。
広く研究されている2つのデータセット、Defects4J V1.2 と ManySStuBs4J について RelRepair の評価を行った。
論文 参考訳(メタデータ) (2025-09-20T14:07:28Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic
Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。
RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。
RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文 参考訳(メタデータ) (2023-09-12T08:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。