Fugu-MT 論文翻訳(概要): SGAgent: Suggestion-Guided LLM-Based Multi-Agent Framework for Repository-Level Software Repair

論文の概要: SGAgent: Suggestion-Guided LLM-Based Multi-Agent Framework for Repository-Level Software Repair

arxiv url: http://arxiv.org/abs/2602.23647v1
Date: Fri, 27 Feb 2026 03:32:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-02 19:48:24.231865
Title: SGAgent: Suggestion-Guided LLM-Based Multi-Agent Framework for Repository-Level Software Repair
Title（参考訳）: SGAgent: Suggestion-Guided LLM-based Multi-Agent Framework for Repository-Level Software repair
Authors: Quanjun Zhang, Chengyu Gao, Yu Han, Ye Shang, Chunrong Fang, Zhenyu Chen, Liang Xiao,
Abstract要約: 本稿では,リポジトリレベルのソフトウェア修復のためのSuggestion-Guided Multi-Agentフレームワークを提案する。 SGAgentは、局所化から修復への移行を強化するための提案段階を導入する。 3つの専門のサブエージェントが協力して、エンドツーエンドのソフトウェアの自動修復を実現します。
参考スコア（独自算出の注目度）: 22.745971570878435
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The rapid advancement of Large Language Models (LLMs) has led to the emergence of intelligent agents capable of autonomously interacting with environments and invoking external tools. Recently, agent-based software repair approaches have received widespread attention, as repair agents can automatically analyze and localize bugs, generate patches, and achieve state-of-the-art performance on repository-level benchmarks. However, existing approaches usually adopt a localize-then-fix paradigm, jumping directly from "where the bug is" to "how to fix it", leaving a fundamental reasoning gap. To this end, we propose SGAgent, a Suggestion-Guided multi-Agent framework for repository-level software repair, which follows a localize-suggest-fix paradigm. SGAgent introduces a suggestion phase to strengthen the transition from localization to repair. The suggester starts from the buggy locations and incrementally retrieves relevant context until it fully understands the bug, and then provides actionable repair suggestions. Moreover, we construct a Knowledge Graph from the target repository and develop a KG-based toolkit to enhance SGAgent's global contextual awareness and repository-level reasoning. Three specialized sub-agents (i.e., localizer, suggester, and fixer) collaborate to achieve automated end-to-end software repair. Experimental results on SWE-Bench show that SGAgent with Claude-3.5 achieves 51.3% repair accuracy, 81.2% file-level and 52.4% function-level localization accuracy with an average cost of $1.48 per instance, outperforming all baselines using the same base model. Furthermore, SGAgent attains 48% accuracy on VUL4J and VJBench for vulnerability repair, demonstrating strong generalization across tasks and programming languages.
Abstract（参考訳）: LLM(Large Language Models)の急速な進歩は、環境と自律的に対話し、外部ツールを呼び出すインテリジェントエージェントの出現につながった。近年,修復エージェントが自動的にバグを分析し,ローカライズし,パッチを生成し,レポジトリレベルのベンチマークで最先端のパフォーマンスを実現するため,エージェントベースのソフトウェア修復アプローチが注目されている。しかし、既存のアプローチは通常ローカライズ・ザ・フィックスのパラダイムを採用しており、"バグのある場所"から"修正する方法"へと直接ジャンプし、根本的な理由の欠如を残している。そこで我々は,SGAgentを提案する。Suggestion-Guided multi-Agent framework for repository-level software repair。 SGAgentは、局所化から修復への移行を強化するための提案段階を導入する。提案者はバグのある場所から始まり、バグが完全に理解されるまで関連するコンテキストを漸進的に検索し、実行可能な修正提案を提供する。さらに、対象リポジトリから知識グラフを構築し、SGAgentのグローバルな文脈認識とリポジトリレベルの推論を強化するKGベースのツールキットを開発する。 3つの専門のサブエージェント(ローカライザ、プロポーラ、フィクスチャ)が協力して、エンドツーエンドのソフトウェアの自動修復を実現している。 SWE-Benchの実験結果によると、Claude-3.5のSGAgentは51.3%の修復精度、81.2%のファイルレベル、52.4%の関数レベルのローカライゼーション精度、インスタンスあたりの平均コストは1.48ドルで、同じベースモデルで全てのベースラインを上回っている。さらに、SGAgentは脆弱性修復のためにVUL4JとVJBenchで48%の精度を達成し、タスクやプログラミング言語をまたいだ強力な一般化を示している。

関連論文リスト

SWE-Adept: An LLM-Based Agentic Framework for Deep Codebase Analysis and Structured Issue Resolution [9.339988760379915]
大規模言語モデル(LLM)は、自己完結したタスクに対して強いパフォーマンスを示す。 SWE-Adeptは、ローカライズエージェントが問題関連コードの位置を特定し、解決エージェントが対応する修正を実装するフレームワークである。 SWE-Bench Lite と SWE-Bench Pro の実験は、SWE-Adept が問題ローカライゼーションと解決の両方において、従来のアプローチよりも一貫して優れていることを示した。
論文参考訳（メタデータ） (2026-03-01T23:52:30Z)
Beyond Accuracy: Behavioral Dynamics of Agentic Multi-Hunk Repair [6.60715519922201]
マルチハンクバグの修復には、複数の非結合コード領域にまたがるコーディネート編集が必要である。我々は、Hunk4Jデータセットから372個のマルチハンクバグ(Claude Code, Codex, Gemini-cli, Qwen Code)を評価する。
論文参考訳（メタデータ） (2025-11-14T07:00:47Z)
Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。計算コストを削減しながら、大きな利益を得ることができます。
論文参考訳（メタデータ） (2025-10-27T17:59:14Z)
Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。 AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文参考訳（メタデータ） (2025-09-29T18:20:27Z)
VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文参考訳（メタデータ） (2025-09-15T02:25:38Z)
SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文参考訳（メタデータ） (2025-03-11T17:53:02Z)
Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。 Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文参考訳（メタデータ） (2024-06-03T15:20:06Z)
A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。 1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文参考訳（メタデータ） (2024-04-26T04:55:35Z)
DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳（メタデータ） (2024-02-27T12:26:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。