論文の概要: HAFixAgent: History-Aware Automated Program Repair Agent
- arxiv url: http://arxiv.org/abs/2511.01047v1
- Date: Sun, 02 Nov 2025 18:45:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.042572
- Title: HAFixAgent: History-Aware Automated Program Repair Agent
- Title(参考訳): HAFixAgent: 履歴対応プログラム修復エージェント
- Authors: Yu Shi, Hao Li, Bram Adams, Ahmed E. Hassan,
- Abstract要約: HAFixAgentはHAFixAgentというヒストリー対応のバグフィクスエージェントで,その修復ループに非難由来のリポジトリを注入する。
Defects4Jの854の実際のバグに関する予備的な研究は、我々の設計を動機付け、バグ関連の歴史が広く利用でき、非常に集中していることを示している。
- 参考スコア(独自算出の注目度): 13.82629698836299
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated program repair (APR) has recently shifted toward large language models and agent-based systems, yet most systems rely on local snapshot context, overlooking repository history. Prior work shows that repository history helps repair single-line bugs, since the last commit touching the buggy line is often the bug-introducing one. In this paper, we investigate whether repository history can also improve agentic APR systems at scale, especially for complex multi-hunk bugs. We present HAFixAgent, a History-Aware Bug-Fixing Agent that injects blame-derived repository heuristics into its repair loop. A preliminary study of all 854 real-world bugs from Defects4J motivates our design, showing that bug-relevant history is both widely available and highly concentrated. Empirical comparison of HAFixAgent with two state-of-the-art baselines shows: (1) Effectiveness: HAFixAgent significantly improves over the agent-based baseline (by 212.3%) and the multi-hunk baseline (by 29.9%). (2) Efficiency: history does not significantly increase agent steps and keeps token costs comparable, with notably lower median costs for complex multi-file-multi-hunk bugs. (3) Practicality: combining different historical heuristics repairs more bugs, offering a clear cost-benefit trade-off. HAFixAgent offers a practical recipe for history-aware agentic APR: ground the agent in version control history, prioritize diff-based historical context, and integrate complementary heuristics when needed.
- Abstract(参考訳): APR(Automated Program repair)は、最近、大規模な言語モデルとエージェントベースのシステムに移行したが、ほとんどのシステムは、リポジトリ履歴を見渡すために、ローカルなスナップショットコンテキストに依存している。
前回の作業では、リポジトリ履歴が単一行のバグの修復に役立つことが示されていた。
本稿では,リポジトリ履歴がエージェントAPRシステムを大規模に改善できるかどうか,特に複雑なマルチファンクバグに対して検討する。
HAFixAgentはHAFixAgentというヒストリ対応のバグフィクスエージェントで,その修復ループに非難に起因したリポジトリヒューリスティックスを注入する。
Defects4Jの854の実際のバグに関する予備的な研究は、我々の設計を動機付け、バグ関連の歴史が広く利用でき、非常に集中していることを示している。
1)有効性: HAFixAgentはエージェントベースライン(212.3%)とマルチハンクベースライン(229.9%)よりも大幅に改善する。
2) 効率性: 履歴はエージェントのステップを著しく増やさず、トークンコストを同等に保ちます。
実用性: 異なる歴史的ヒューリスティックを組み合わせることで、より多くのバグを修復し、明らかなコスト対効果のトレードオフを提供する。
HAFixAgentは、歴史を意識したエージェントAPRの実践的なレシピを提供する: バージョン管理履歴のエージェントを基盤にし、diffベースの履歴コンテキストを優先順位付けし、必要に応じて補完的なヒューリスティックを統合する。
関連論文リスト
- Holistic Agent Leaderboard: The Missing Infrastructure for AI Agent Evaluation [87.47155146067962]
数百のタスクで並列評価をオーケストレーションする,標準化された評価ハーネスを提供する。
モデル、足場、ベンチマークにまたがる3次元解析を行う。
私たちの分析では、ほとんどのランで精度を低下させる高い推論努力など、驚くべき洞察が示されています。
論文 参考訳(メタデータ) (2025-10-13T22:22:28Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - Evaluating Agent-based Program Repair at Google [9.62742759337993]
エージェントベースのプログラム修復は、複雑なバグをエンドツーエンドで自動的に解決する。
最近の研究は、人気のあるオープンソースSWE-Benchにおけるエージェントベースの修復アプローチの使用について検討している。
本稿では,企業コンテキストにおけるバグに対処するためのエージェント的アプローチの適用可能性について検討する。
論文 参考訳(メタデータ) (2025-01-13T18:09:25Z) - Evaluating Software Development Agents: Patch Patterns, Code Quality, and Issue Complexity in Real-World GitHub Scenarios [13.949319911378826]
この調査は、500の現実のGitHubイシューで上位10のエージェントから4,892のパッチを評価した。
一人のエージェントが支配的であり、170の問題が未解決であり、改善の余地があった。
ほとんどのエージェントはコードの信頼性とセキュリティを維持し、新しいバグや脆弱性を避けた。
一部のエージェントはコードの複雑さを増し、多くの重複を減らし、コードの臭いを最小限にした。
論文 参考訳(メタデータ) (2024-10-16T11:33:57Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。
1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文 参考訳(メタデータ) (2024-04-26T04:55:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。