論文の概要: Dynamic Cogeneration of Bug Reproduction Test in Agentic Program Repair
- arxiv url: http://arxiv.org/abs/2601.19066v1
- Date: Tue, 27 Jan 2026 01:02:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.111301
- Title: Dynamic Cogeneration of Bug Reproduction Test in Agentic Program Repair
- Title(参考訳): エージェントプログラム修復におけるバグ再現試験の動的コージェネレーション
- Authors: Runxiang Cheng, Michele Tufano, José Cambronero, Renyao Wei, Sherry Shi, Grant Uy, Pat Rondon, Franjo Ivančić,
- Abstract要約: バグ再現テスト(BRT)は多くのエージェント自動プログラム修復(APR)システムで使用されている。
実際には、開発者がパッチを提出すると、しばしば修正と一緒にBRTを実装します。
コージェネレーションにより、APRエージェントは専用のBRTエージェントと同じくらい多くのバグに対してBRTを生成することができる。
- 参考スコア(独自算出の注目度): 4.994693185232122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bug Reproduction Tests (BRTs) have been used in many agentic Automated Program Repair (APR) systems, primarily for validating promising fixes and aiding fix generation. In practice, when developers submit a patch, they often implement the BRT alongside the fix. Our experience deploying agentic APR reveals that developers similarly desire a BRT within AI-generated patches to increase their confidence. However, canonical APR systems tend to generate BRTs and fixes separately, or focus on producing only the fix in the final patch. In this paper, we study agentic APR in the context of cogeneration, where the APR agent is instructed to generate both a fix and a BRT in the same patch. We evaluate the effectiveness of different cogeneration strategies on 120 human-reported bugs at Google and characterize different cogeneration strategies by their influence on APR agent behavior. We develop and evaluate patch selectors that account for test change information to select patches with plausible fixes (and plausible BRTs). Finally, we analyze the root causes of failed cogeneration trajectories. Importantly, we show that cogeneration allows the APR agent to generate BRTs for at least as many bugs as a dedicated BRT agent, without compromising the generation rate of plausible fixes, thereby reducing engineering effort in maintaining and coordinating separate generation pipelines for fix and BRT at scale.
- Abstract(参考訳): バグ再現テスト(BRT)は、多くのエージェント自動プログラム修復(APR)システムで、主に有望な修正の検証と修正生成の支援に使用されている。
実際には、開発者がパッチを提出すると、しばしば修正と一緒にBRTを実装します。
エージェントAPRをデプロイした経験から、開発者は同様にAI生成パッチ内のBRTを望んでおり、信頼性を高めています。
しかし、標準のAPRシステムはBRTと修正を別々に生成するか、最終パッチで修正のみを生成することに集中する傾向にある。
本稿では,コージェネレーションにおけるエージェントAPRについて検討し,APRエージェントに同じパッチで修正とBRTの両方を生成するように指示する。
我々は,Googleにおける120の人為的報告バグに対する異なるコージェネレーション戦略の有効性を評価し,それらがAPRエージェントの挙動に与える影響によって異なるコージェネレーション戦略を特徴付ける。
テスト変更情報を考慮したパッチセレクタを開発し評価し,修正可能なパッチ(およびBRT)を選択する。
最後に, コージェネレーション・トラジェクトリーの根本原因を解析した。
重要なことは、コージェネレーションにより、APRエージェントは、修正可能な生成速度を損なうことなく、専用のBRTエージェントとして、少なくとも多くのバグに対してBRTを生成することができ、これにより、修正用とBRTの個別生成パイプラインを大規模に維持・調整するエンジニアリングの労力を削減できることである。
関連論文リスト
- DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Alita-G: Self-Evolving Generative Agent for Agent Generation [54.49365835457433]
汎用エージェントをドメインエキスパートに変換するフレームワークであるALITA-Gを提案する。
このフレームワークでは、ジェネラリストエージェントが対象ドメインタスクのキュレートされたスイートを実行する。
計算コストを削減しながら、大きな利益を得ることができます。
論文 参考訳(メタデータ) (2025-10-27T17:59:14Z) - REFINE: Enhancing Program Repair Agents through Context-Aware Patch Refinement [12.995571513415905]
大規模言語モデル(LLM)は、最近、自動プログラム修復(APR)に強い可能性を示している。
LLMは、コードコンテキストの限定的な理解と不完全なテストスイートへの過度な信頼のために、正しい修正を作成するのに苦労することが多い。
本稿では,ドラフトパッチを正しいものに体系的に変換する新しいパッチリファインメントフレームワークRefineを提案する。
論文 参考訳(メタデータ) (2025-10-04T00:34:32Z) - Abstain and Validate: A Dual-LLM Policy for Reducing Noise in Agentic Program Repair [7.118712516789191]
Agentic Automated Program repair (APR)は、ますます複雑なリポジトリレベルのバグに対処している。
互換性のないパッチを開発者に示すと、かなりのノイズが発生する可能性がある。
このようなノイズを減らすために,バグ回避とパッチ検証という2つの補完的なポリシーを導入する。
論文 参考訳(メタデータ) (2025-10-03T17:53:28Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving [62.71545696485824]
我々は,異種エージェントフレームワーク間のシームレスな体験共有を可能にするユニバーサルメモリ基盤であるAgent KBを紹介した。
Agent KBはトラジェクトリを構造化知識ベースに集約し、軽量APIを提供する。
我々は,GAIA,Humanity's Last Exam,GPQA,SWE-benchなどの主要フレームワークにまたがるエージェントを検証した。
論文 参考訳(メタデータ) (2025-07-08T17:59:22Z) - Agentic Bug Reproduction for Effective Automated Program Repair at Google [9.64193881099048]
本稿では,業界,特にGoogleにおけるBRTの自動生成について検討する。
我々は、最先端のBRT生成技術であるLIBROを適応し、評価し、エージェントベースのアプローチであるBRT Agentを提示する。
以上の結果から,APRシステムにBRTを提供することで,バグが30%増えることが判明した。
論文 参考訳(メタデータ) (2025-02-03T20:57:17Z) - RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic
Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。
RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。
RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文 参考訳(メタデータ) (2023-09-12T08:52:56Z) - Improving Automated Program Repair with Domain Adaptation [0.0]
自動プログラム修復(APR)は、ソースコードのバグ/欠陥を修正するプロセスとして、自動化ツールによって定義される。
APRツールは最近、最先端のニューラルネットワーク処理(NLP)技術を活用することで、有望な結果を経験している。
論文 参考訳(メタデータ) (2022-12-21T23:52:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。