Fugu-MT 論文翻訳(概要): APRMCTS: Improving LLM-based Automated Program Repair with Iterative Tree Search

論文の概要: APRMCTS: Improving LLM-based Automated Program Repair with Iterative Tree Search

arxiv url: http://arxiv.org/abs/2507.01827v1
Date: Wed, 02 Jul 2025 15:44:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-03 14:23:00.36275
Title: APRMCTS: Improving LLM-based Automated Program Repair with Iterative Tree Search
Title（参考訳）: APRMCTS:反復木探索によるLCMに基づく自動プログラム修復の改善
Authors: Haichuan Hu, Congqing He, Hao Zhang, Xiaochen Xie, Quanjun Zhang,
Abstract要約: APRMCTS はモンテカルロ木探索 (MCTS) をパッチ探索に取り入れ、探索されたパッチのグローバル評価を行い、改良と生成のために最も有望なパッチを選択する。 Defects4Jの835のバグに関する実験では、GPT-3.5と統合すると、APRMCTSは合計201のバグを修正でき、すべての最先端のベースラインを上回ります。
参考スコア（独自算出の注目度）: 6.314858275160081
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated Program Repair (APR) attempts to fix software bugs without human intervention, which plays a crucial role in software development and maintenance. Recently, with the advances in Large Language Models (LLMs), a rapidly increasing number of APR techniques have been proposed with remarkable performance. However, existing LLM-based APR techniques typically adopt trial-and-error strategies, which suffer from two major drawbacks: (1) inherently limited patch effectiveness due to local exploration, and (2) low search efficiency due to redundant exploration. In this paper, we propose APRMCTS, which uses iterative tree search to improve LLM-based APR. APRMCTS incorporates Monte Carlo Tree Search (MCTS) into patch searching by performing a global evaluation of the explored patches and selecting the most promising one for subsequent refinement and generation. APRMCTS effectively resolves the problems of falling into local optima and thus helps improve the efficiency of patch searching. Our experiments on 835 bugs from Defects4J demonstrate that, when integrated with GPT-3.5, APRMCTS can fix a total of 201 bugs, which outperforms all state-of-the-art baselines. Besides, APRMCTS helps GPT-4o-mini, GPT-3.5, Yi-Coder-9B, and Qwen2.5-Coder-7B to fix 30, 27, 37, and 28 more bugs, respectively. More importantly, APRMCTS boasts a significant performance advantage while employing small patch size (16 and 32), notably fewer than the 500 and 10,000 patches adopted in previous studies. In terms of cost, compared to existing state-of-the-art LLM-based APR methods, APRMCTS has time and monetary costs of less than 20% and 50%, respectively. Our extensive study demonstrates that APRMCTS exhibits good effectiveness and efficiency, with particular advantages in addressing complex bugs.
Abstract（参考訳）: 自動プログラム修正(APR)は、人間の介入なしにソフトウェアバグを修正しようとする。近年,Large Language Models (LLMs) の進歩に伴い,顕著な性能を持つAPR技術が急速に増加している。しかし,従来のLDMベースのAPR技術では,局所探索によるパッチの有効性の制限と,冗長探索による探索効率の低下という2つの大きな欠点を負うトライ・アンド・エラー戦略が一般的である。本稿では,反復木探索を用いてLLMに基づくAPRを改善するAPRMCTSを提案する。 APRMCTS はモンテカルロ木探索 (MCTS) をパッチ探索に取り入れ、探索されたパッチのグローバル評価を行い、改良と生成のために最も有望なパッチを選択する。 APRMCTSは局所最適状態に陥る問題を効果的に解決し、パッチ探索の効率を向上させる。 Defects4Jの835のバグに関する実験では、GPT-3.5と統合すると、APRMCTSは合計201のバグを修正でき、すべての最先端のベースラインを上回ります。さらに、APRMCTSはGPT-4o-mini、GPT-3.5、Yi-Coder-9B、Qwen2.5-Coder-7Bをそれぞれ30、27、37、28のバグを修正できる。さらに重要なことに、APRMCTSは、小さなパッチサイズ(16と32)を採用しながら、大きなパフォーマンス上の優位性を持っている。コストの面では、既存のLLMベースのAPR法と比較して、APRMCTSは、それぞれ20%未満と50%未満の時間と金銭的コストを持っている。本研究は, APRMCTSが複雑なバグに対処する上で, 有効性と有効性を示すことを示すものである。

関連論文リスト

From Empirical Evaluation to Context-Aware Enhancement: Repairing Regression Errors with LLMs [1.078085076551721]
Javaレグレッションバグに関するAPRテクニックを実証研究する。 RegMiner4APRは、広く使用されている32の現実世界のJava GitHubリポジトリから収集されたJava回帰バグのベンチマークである。以上の結果から,従来のAPRツールはバグ修正に失敗し,LSMベースのAPRアプローチは有望な可能性を秘めていることがわかった。
論文参考訳（メタデータ） (2025-06-16T07:49:18Z)
Fixing 7,400 Bugs for 1$: Cheap Crash-Site Program Repair [26.981770213053004]
本報告では, 事故現場の修復作業の簡易化を図るとともに, 被害発生リスクを軽減しつつ, 修復作業の簡易化を図っている。大規模言語モデル(LLM)のトークンコストを大幅に削減するテンプレート誘導型パッチ生成手法を提案する。以上の結果から,トップパフォーマンスエージェントであるCodeRover-Sと組み合わせることで,トークンコストを45.9%削減し,ARVO上でのバグフィックス率を73.5%(+29.6%)に向上させることができた。
論文参考訳（メタデータ） (2025-05-19T13:32:51Z)
The Art of Repair: Optimizing Iterative Program Repair with Instruction-Tuned Models [48.073219761367184]
複数出力の生成と複数ラウンドの反復のバランスをとるAPRパイプラインについて検討する。 3つのサイズ(1K, 30K, 65K)と2つのテクニック(フルファインチューニングとLoRA)を持つAPRデータセット上で各モデルを微調整する。その結果,微調整データセットのごく一部(1%)しか使用せず,最大78%の改善が達成できた。
論文参考訳（メタデータ） (2025-05-05T18:06:51Z)
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文参考訳（メタデータ） (2024-10-03T18:12:29Z)
Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文参考訳（メタデータ） (2024-07-01T17:07:55Z)
Hybrid Automated Program Repair by Combining Large Language Models and Program Analysis [12.7034916462208]
自動プログラム修復(APR)は、人間の開発者のバグ修正プロセスを合理化する可能性から、大きな注目を集めている。本稿ではGIANTREPAIRと呼ばれる革新的なAPR手法を紹介する。この知見に基づいて、GIANTREPAIRはまず、LLM生成したパッチからパッチスケルトンを構築して、パッチ空間を閉じ込め、その後、特定のプログラムに適した高品質なパッチを生成する。
論文参考訳（メタデータ） (2024-06-03T05:05:12Z)
Practical Program Repair via Preference-based Ensemble Strategy [28.176710503313895]
本稿では、異なるバグを修復するためのAPRツールのランク付けを行うためのPreference-based Ensemble Program repair framework(P-EPR)を提案する。 P-EPRは、修復パターンを利用した最初の非学習ベースのAPRアンサンブル法である。実験の結果,P-EPRは柔軟性と有効性の両方において既存の戦略よりも優れていた。
論文参考訳（メタデータ） (2023-09-15T07:23:04Z)
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。 RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。 RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文参考訳（メタデータ） (2023-09-12T08:52:56Z)
Optimizing Two-way Partial AUC with an End-to-end Framework [154.47590401735323]
ROC曲線のエリア(AUC)は、機械学習にとって重要な指標である。最近の研究は、TPAUCが既存のPartial AUCメトリクスと本質的に矛盾していることを示している。本論文では,この新指標を最適化するための最初の試行について述べる。
論文参考訳（メタデータ） (2022-06-23T12:21:30Z)
The Surprising Effectiveness of MAPPO in Cooperative, Multi-Agent Games [67.47961797770249]
マルチエージェントPPO(MAPPO)は、集中型値関数を採用するマルチエージェントPPOバリアントである。 MAPPOは,3つの一般的なマルチエージェントテストベッドにおいて,最先端技術に匹敵する性能を実現していることを示す。
論文参考訳（メタデータ） (2021-03-02T18:59:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。