論文の概要: SiblingRepair: Sibling-Based Multi-Hunk Repair with Large Language Models
- arxiv url: http://arxiv.org/abs/2605.06209v1
- Date: Thu, 07 May 2026 13:14:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.81974
- Title: SiblingRepair: Sibling-Based Multi-Hunk Repair with Large Language Models
- Title(参考訳): SiblingRepair: 大規模言語モデルによる兄弟ベースマルチハンク修復
- Authors: Xinyu Liu, Jiayu Ren, Yusen Wang, Qi Xin, Xiaoyuan Xie, Jifeng Xuan,
- Abstract要約: 兄弟修復に特化したLLMベースのマルチハンクAPR技術であるSiblingRepairを提案する。
不審な場所から始まるSiblingRepairは、トークンと埋め込みベースのコードマッチングを使用して、意味的に関連する兄弟候補を検索する。
次にLLMを使用して、障害関連兄弟を識別し、2つの補完的な戦略を通じて一貫したパッチを生成する。
- 参考スコア(独自算出の注目度): 8.90705329392185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developers often make similar mistakes across code locations implementing related functionalities. These locations, called siblings, share similar issues and require similar fixes. Accurately identifying siblings and consistently repairing them are crucial for automated program repair. Hercules is a SOTA technique designed for sibling repair. However, it is limited by strong assumptions about sibling locations and commit-history availability, rigid AST-based sibling matching, and inflexible template-based patch generation. To address these limitations, we present SiblingRepair, a new LLM-based multi-hunk APR technique specialized for sibling repair. Starting from a suspicious location identified by spectrum-based fault localization, SiblingRepair searches for semantically related sibling candidates using token- and embedding-based code matching, without restricting discovery to failing-test coverage or commit history. It then uses an LLM to identify failure-relevant siblings and generate consistent patches through two complementary strategies: simultaneous repair, which jointly repairs siblings, and iterative repair, which progressively analyzes candidates for patch construction. SiblingRepair further preserves promising patches generated from earlier suspicious locations and combines them into generalized multi-hunk patches. We evaluate SiblingRepair on the Defects4J and GHRB benchmarks. The results show that SiblingRepair substantially outperforms SOTA multi-hunk repair techniques including Hercules. Our evaluation further demonstrates its repair efficiency, the effectiveness of its sibling detection and repair components, and limited impact of the LLM data leakage on the results. Overall, SiblingRepair advances automated sibling and general multi-hunk repair.
- Abstract(参考訳): 開発者はしばしば、関連する機能を実装するコード場所間で同様の間違いを犯す。
これらの場所は兄弟姉妹と呼ばれ、同様の問題を共有し、同様の修正が必要である。
兄弟姉妹を正確に識別し、継続的に修復することは、プログラムの自動修復に不可欠である。
Herculesは、兄弟の修理用に設計されたSOTA技術である。
しかし、兄弟姉妹の位置とコミット履歴の可用性、堅固なASTベースの兄弟マッチング、柔軟性のないテンプレートベースのパッチ生成に関する強い仮定によって制限されている。
これらの制約に対処するために、兄弟修復に特化した新しいLLMベースのマルチハンクAPR技術であるSiblingRepairを提案する。
スペクトルベースの障害ローカライゼーションによって特定された疑わしい位置から始まるSiblingRepairは、トークンと埋め込みベースのコードマッチングを使用して、発見をフェールテストカバレッジやコミット履歴に制限することなく、意味的に関連する兄弟候補を検索する。
次に、LCMを使用して障害関連兄弟を識別し、2つの補完的な戦略により一貫したパッチを生成する。
SiblingRepairはさらに、以前に不審な場所から生成された有望なパッチを保存し、それらを一般化されたマルチハンクパッチに結合する。
The Defects4J and GHRB benchmarks on the SiblingRepair on the Defects4J and GHRB benchmarks。
その結果,SyblingRepairはHerculesを含むSOTAマルチハンク補修技術よりも大幅に優れていた。
さらに, その修復効率, 兄弟検出および補修部品の有効性, およびLCMデータ漏洩が結果に与える影響について検討した。
全体として、SiblingRepairは自動シブリングと一般的なマルチハンク修復を前進させる。
関連論文リスト
- QiMeng-PRepair: Precise Code Repair via Edit-Aware Reward Optimization [50.722636027998]
大規模言語モデル (LLM) はプログラム修復性能が高いが、しばしば過剰な編集に悩まされる。
オーバー編集を軽減し,修復精度を向上させるフレームワークであるPRepairを提案する。
論文 参考訳(メタデータ) (2026-04-07T14:56:38Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [79.74676890436174]
本稿では,障害の局所化と修復のためのオラクルとして形式仕様を用いたDafny用のAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoareロジックの使用を含む一連のステップを通じて、障害をローカライズします。
また, GPT-4o miniが74.18%と高い修理成功率を示した。
論文 参考訳(メタデータ) (2025-07-04T15:36:12Z) - Repair Ingredients Are All You Need: Improving Large Language Model-Based Program Repair via Repair Ingredients Search [41.50068103527948]
ReinFixは、バグ修正の推論と解決フェーズを通じて、修復材料を検索するフレームワークである。
ソリューションフェーズでは、ReinFixは、同様のバグパターンで過去のバグ修正から外部の要素を検索する。
2つの人気のあるベンチマークによる評価は、SOTAベースラインに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2025-06-29T06:02:11Z) - Studying and Understanding the Effectiveness and Failures of Conversational LLM-Based Repair [3.93048798243871]
自動プログラム修復(APR)は、バグ修正のプロセスを自動化するように設計されている。
会話言語モデル(LLM)を利用した高度なAPR技術は、目覚ましい修復能力を示した。
優位性にもかかわらず、会話型APR技術は依然として多くのバグを修復することができない。
論文 参考訳(メタデータ) (2025-03-19T09:39:32Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - ContrastRepair: Enhancing Conversation-Based Automated Program Repair
via Contrastive Test Case Pairs [23.419180504723546]
ContrastRepairは、対照的なテストペアを提供することで、会話駆動型APRを強化する、新しいAPRアプローチである。
Defects4j、QuixBugs、HumanEval-Javaなど、複数のベンチマークデータセット上でContrastRepairを評価する。
論文 参考訳(メタデータ) (2024-03-04T12:15:28Z) - RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic
Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。
RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。
RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文 参考訳(メタデータ) (2023-09-12T08:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。