論文の概要: PracRepair: LLM-Empowered Automated Program Repair Inspired by Human-Like Debugging Practices
- arxiv url: http://arxiv.org/abs/2606.17612v1
- Date: Tue, 16 Jun 2026 07:18:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.327768
- Title: PracRepair: LLM-Empowered Automated Program Repair Inspired by Human-Like Debugging Practices
- Title(参考訳): PracRepair: ヒューマンライクなデバッグプラクティスに触発されたLLMを利用した自動プログラム修復
- Authors: Yu Cheng, Zhongxin Liu, Zhenchang Xing, Chao Ni, Qing Huang, Xiaoxue Ren,
- Abstract要約: textscPracRepairは、人間のようなデバッグプラクティスにインスパイアされた、完全に自動化されたプログラム修復フレームワークである。
textscPracRepairは一貫して最先端のベースラインを上回っている。
textscPracRepairはRWB(Real-World Bugs)に効果的に一般化する
- 参考スコア(独自算出の注目度): 22.432182416621917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As software systems grow in scale and complexity, debugging and repair remain costly and time-consuming. Large language models (LLMs) have advanced automated program repair (APR), but existing LLM-based APR approaches still largely rely on static or retrieved context, error messages, and coarse-grained validation outcomes. As a result, they underutilize dynamic information for failure understanding and repair, including failure-execution dynamics and patch-validation dynamics. Effectively leveraging such information, however, is challenging: failure-execution traces are large and noisy, raw static-dynamic context is not self-explanatory, and patch-validation dynamics are often reduced to coarse feedback. To address these challenges, we propose \textsc{PracRepair}, a fully automated LLM-based APR framework inspired by human-like debugging practices. \textsc{PracRepair} constructs an on-demand static-dynamic context from buggy programs and failure executions, performs question-driven failure diagnosis to formulate explicit repair hypotheses, and iteratively refines candidate patches using validation diagnostics and trace-level behavioral changes. Experimental results on Defects4J V1.2 and V2.0 show that \textsc{PracRepair} consistently outperforms state-of-the-art baselines. Specifically, under GPT-3.5, \textsc{PracRepair} correctly fixes 139/136 bugs on Defects4J V1.2/V2.0, while under GPT-4o it further improves to 162/171. Moreover, \textsc{PracRepair} generalizes effectively to RWB (Real-World Bugs), achieving the best performance across multiple foundation models.
- Abstract(参考訳): ソフトウェアシステムがスケールと複雑さを増すにつれて、デバッグと修復はコストと時間を要する。
大規模言語モデル(LLM)には高度な自動プログラム修復(APR)があるが、既存のLLMベースのAPRアプローチは、静的または検索されたコンテキスト、エラーメッセージ、粗い粒度の検証結果に大きく依存している。
その結果、フェール・エグゼクティブ・ダイナミクスやパッチ・バリデーション・ダイナミクスといった、障害の理解と修復のために、動的情報を過小評価する。
しかし、そのような情報を効果的に活用することは難しい。障害実行トレースは巨大でノイズがあり、生の静的なコンテキストは自己説明的ではなく、パッチ検証のダイナミクスは粗いフィードバックに還元されることが多い。
これらの課題に対処するために,人間的なデバッグプラクティスにヒントを得た,完全に自動化されたLLMベースのAPRフレームワークである‘textsc{PracRepair} を提案する。
\textsc{PracRepair}は、バギープログラムと障害実行からオンデマンドの静的なコンテキストを構築し、明示的な修復仮説を定式化するために質問駆動型障害診断を実行し、検証診断とトレースレベルの動作変化を使用して、候補パッチを反復的に洗練する。
Defects4J V1.2 と V2.0 の実験結果から、 \textsc{PracRepair} は最先端のベースラインを一貫して上回っている。
具体的には、GPT-3.5の下では、textsc{PracRepair}はDefects4J V1.2/V2.0の139/136のバグを正しく修正し、GPT-4oでは162/171に改善した。
さらに、textsc{PracRepair} は RWB (Real-World Bugs) に効果的に一般化し、複数の基礎モデルで最高のパフォーマンスを達成する。
関連論文リスト
- DebugHarness: Emulating Human Dynamic Debugging for Autonomous Program Repair [8.290621289192048]
DebugHarnessはLarge Language Model (LLM)を利用した自動デバッグエージェントである。
静的コードを調べる代わりに、DebugHarnessはライブランタイム環境に積極的に問い合わせる。
実世界のC/C++セキュリティ脆弱性の厳格なデータセットであるSEC-bench上でDebugHarnessを評価する。
論文 参考訳(メタデータ) (2026-04-04T06:49:30Z) - Runtime Execution Traces Guided Automated Program Repair with Multi-Agent Debate [8.424102114588559]
自動プログラム修復(APR)は複雑なロジックエラーとサイレント障害に悩まされる。
現在のLLMベースのAPRメソッドは主に静的であり、ソースコードと基本的なテスト出力に依存している。
我々は、パッチ検証のための共有制約としてランタイム事実を活用するマルチエージェントフレームワークであるTraceRepairを提案する。
論文 参考訳(メタデータ) (2026-04-03T02:23:25Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - DynaFix: Iterative Automated Program Repair Driven by Execution-Level Dynamic Information [20.300297868395454]
自動プログラム修復(APR)は、バグギープログラムの正しいパッチを自動的に生成することを目的としている。
大規模言語モデル(LLM)を活用する最近のアプローチは、将来性を示しているが制限に直面している。
本研究では,実行レベルの動的情報駆動型APR手法であるDynaFixを提案する。
論文 参考訳(メタデータ) (2025-12-31T05:13:34Z) - InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。
対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文 参考訳(メタデータ) (2025-10-21T06:26:29Z) - RePaCA: Leveraging Reasoning Large Language Models for Static Automated Patch Correctness Assessment [0.0]
本稿では,Large Language Models (LLM) を利用した新しい静的APCA手法であるRePaCAを紹介する。
提案手法は,83.1%の精度と84.8%のF1スコアで最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-07-30T11:21:09Z) - Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [79.74676890436174]
本稿では,障害の局所化と修復のためのオラクルとして形式仕様を用いたDafny用のAPRツールを提案する。
プログラム内の各ステートメントの状態を決定するために、Hoareロジックの使用を含む一連のステップを通じて、障害をローカライズします。
また, GPT-4o miniが74.18%と高い修理成功率を示した。
論文 参考訳(メタデータ) (2025-07-04T15:36:12Z) - Towards Practical and Useful Automated Program Repair for Debugging [4.216808129651161]
PracAPRは統合開発環境(IDE)で動作する対話型修復システムである
PracAPRはテストスイートやプログラムの再実行を必要としない。
論文 参考訳(メタデータ) (2024-07-12T03:19:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。