Fugu-MT 論文翻訳(概要): Repair Ingredients Are All You Need: Improving Large Language Model-Based Program Repair via Repair Ingredients Search

論文の概要: Repair Ingredients Are All You Need: Improving Large Language Model-Based Program Repair via Repair Ingredients Search

arxiv url: http://arxiv.org/abs/2506.23100v1
Date: Sun, 29 Jun 2025 06:02:11 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-01 21:27:53.715944
Title: Repair Ingredients Are All You Need: Improving Large Language Model-Based Program Repair via Repair Ingredients Search
Title（参考訳）: 言語モデルに基づく大規模プログラム修復の改善
Authors: Jiayi Zhang, Kai Huang, Jian Zhang, Yang Liu, Chunyang Chen,
Abstract要約: ReinFixは、バグ修正の推論と解決フェーズを通じて、修復材料を検索するフレームワークである。ソリューションフェーズでは、ReinFixは、同様のバグパターンで過去のバグ修正から外部の要素を検索する。 2つの人気のあるベンチマークによる評価は、SOTAベースラインに対するアプローチの有効性を示す。
参考スコア（独自算出の注目度）: 41.50068103527948
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated Program Repair (APR) techniques aim to automatically fix buggy programs. Among these, Large Language Model-based (LLM-based) approaches have shown great promise. Recent advances demonstrate that directly leveraging LLMs can achieve leading results. However, these techniques remain suboptimal in generating contextually relevant and accurate patches, as they often overlook repair ingredients crucial for practical program repair. In this paper, we propose ReinFix, a novel framework that enables LLMs to autonomously search for repair ingredients throughout both the reasoning and solution phases of bug fixing. In the reasoning phase, ReinFix integrates static analysis tools to retrieve internal ingredients, such as variable definitions, to assist the LLM in root cause analysis when it encounters difficulty understanding the context. During the solution phase, when the LLM lacks experience in fixing specific bugs, ReinFix searches for external ingredients from historical bug fixes with similar bug patterns, leveraging both the buggy code and its root cause to guide the LLM in identifying appropriate repair actions, thereby increasing the likelihood of generating correct patches. Evaluations on two popular benchmarks (Defects4J V1.2 and V2.0) demonstrate the effectiveness of our approach over SOTA baselines. Notably, ReinFix fixes 146 bugs, which is 32 more than the baselines on Defects4J V1.2. On Defects4J V2.0, ReinFix fixes 38 more bugs than the SOTA. Importantly, when evaluating on the recent benchmarks that are free of data leakage risk, ReinFix also maintains the best performance.
Abstract（参考訳）: 自動プログラム修復(APR)技術は、バグジィプログラムを自動的に修正することを目的としている。これらのうち、Large Language Model-based (LLMベース)アプローチは、非常に有望である。近年の進歩により, LLMを直接活用することで, 先進的な成果が得られている。しかし、これらの手法は、実践的なプログラム修復に不可欠な修理資材を見落としていることが多いため、文脈的に関連性があり、正確なパッチを生成するのに最適である。本稿では,LLM がバグ修正の理性と解の両段階にわたって,修復材料を自律的に探索することを可能にする新しいフレームワーク ReinFix を提案する。推論フェーズでは、ReinFixは静的解析ツールを統合して、変数定義などの内部成分を検索し、コンテキストを理解するのが困難である場合に、LLMのルート原因分析を支援する。ソリューションフェーズでは、LLMに特定のバグを修正する経験がない場合、ReinFixは、バグコードとその根本原因の両方を活用して、バグ修正から外部のコンポーネントを検索し、適切な修正動作を特定するためにLLMをガイドし、正しいパッチを生成する可能性を高める。 2つの人気のあるベンチマーク(Defects4J V1.2とV2.0)で評価した結果,SOTAベースラインに対するアプローチの有効性が示された。特に、ReinFixは146のバグを修正し、Defects4J V1.2のベースラインより32多い。 Defects4J V2.0では、ReinFixはSOTAよりも38のバグを修正している。重要なことは、データ漏洩のリスクのない最近のベンチマークを評価するとき、ReinFixは最高のパフォーマンスも維持する。

関連論文リスト

Do AI models help produce verified bug fixes? [62.985237003585674]
大規模言語モデルは、ソフトウェアバグの修正に使用される。本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文参考訳（メタデータ） (2025-07-21T17:30:16Z)
Specification-Guided Repair of Arithmetic Errors in Dafny Programs using LLMs [84.30534714651093]
本稿では,検証を意識したプログラミング言語であるDafnyに対して,革新的なAPRツールを提案する。プログラム内の各ステートメントの状態を決定するために、Hoare Logicの使用を含む一連のステップを通じて、障害をローカライズします。実世界のDafnyプログラムのベンチマークであるDafnyBenchを用いて,我々のアプローチを評価する。
論文参考訳（メタデータ） (2025-07-04T15:36:12Z)
Studying and Understanding the Effectiveness and Failures of Conversational LLM-Based Repair [3.93048798243871]
自動プログラム修復(APR)は、バグ修正のプロセスを自動化するように設計されている。会話言語モデル(LLM)を利用した高度なAPR技術は、目覚ましい修復能力を示した。優位性にもかかわらず、会話型APR技術は依然として多くのバグを修復することができない。
論文参考訳（メタデータ） (2025-03-19T09:39:32Z)
ThinkRepair: Self-Directed Automated Program Repair [11.598008952093487]
プロンプトエンジニアリングによって指示された大規模言語モデル(LLM)は、バグ修正を含む多くのタスクに対処する強力な能力に多くの注目を集めている。本稿では,自己指向型LLMベースの自動プログラム修復であるThinkRepairについて,収集フェーズと固定フェーズの2つの主要なフェーズを提案する。 ThinkRepairと12SOTA APRを比較した2つの広く研究されているデータセット(Defects4JとQuixBugs)の評価は、バグ修正におけるThinkRepairの優先度を示している。
論文参考訳（メタデータ） (2024-07-30T15:17:07Z)
Investigating the Transferability of Code Repair for Low-Resource Programming Languages [57.62712191540067]
大規模言語モデル(LLM)は、コード生成タスクにおいて顕著なパフォーマンスを示している。近年の作業は、連鎖推論や蒸留といった現代的な技術を統合することで、コード修復のプロセスを強化している。高低資源言語と低低資源言語の両方でコード修復を蒸留する利点について検討する。
論文参考訳（メタデータ） (2024-06-21T05:05:39Z)
A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。 1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文参考訳（メタデータ） (2024-04-26T04:55:35Z)
Aligning the Objective of LLM-based Program Repair [14.935596175148586]
本稿では,大規模言語モデル (LLM) をプログラム修復に適用するための新しいアプローチについて検討する。我々の中核的な洞察は、LLMのAPR能力は、単にトレーニング目標に出力を合わせるだけで大幅に改善できるということです。この知見に基づいて、我々はAPRの直接的なプロンプトフレームワークであるD4Cを設計した。
論文参考訳（メタデータ） (2024-04-13T02:36:40Z)
ContrastRepair: Enhancing Conversation-Based Automated Program Repair via Contrastive Test Case Pairs [23.419180504723546]
ContrastRepairは、対照的なテストペアを提供することで、会話駆動型APRを強化する、新しいAPRアプローチである。 Defects4j、QuixBugs、HumanEval-Javaなど、複数のベンチマークデータセット上でContrastRepairを評価する。
論文参考訳（メタデータ） (2024-03-04T12:15:28Z)
A Novel Approach for Automatic Program Repair using Round-Trip Translation with Large Language Models [50.86686630756207]
研究によると、ある文の文法的誤りは、それを他の言語に翻訳し、その語を返せば修正できる。現在の自動プログラム修復(APR)生成モデルは、ソースコードで事前訓練され、修正のために微調整されている。本稿では,あるプログラミング言語から別のプログラミング言語,あるいは自然言語へのコード変換,そして,その逆といった,微調整ステップをバイパスし,ラウンド・トリップ変換(RTT)を用いる手法を提案する。
論文参考訳（メタデータ） (2024-01-15T22:36:31Z)
RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair [8.321263361036808]
そこで我々は,APRの最適なコード表現を微調整モデルで識別する新しいプログラム修復手法であるRe repairLLaMAを提案する。これにより、AIでバグを修正するのに非常に効果的なプログラム修復アダプタが提供される。全体として、Re repairLLaMAは144のDefects4J v2、109のHumanEval-Java、20のGitBug-Javaバグを正しく修正する。
論文参考訳（メタデータ） (2023-12-25T11:39:46Z)
Lyra: Orchestrating Dual Correction in Automated Theorem Proving [63.115422781158934]
Lyraは新しいフレームワークで、ツール補正とConjecture Correctionという2つの異なる補正メカニズムを採用している。ツール補正は幻覚の緩和に寄与し、それによって証明の全体的な精度が向上する。 Conjecture Correctionは命令で生成を洗練させるが、ペア化された(生成、エラー、改善)プロンプトは収集しない。
論文参考訳（メタデータ） (2023-09-27T17:29:41Z)
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。 RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。 RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文参考訳（メタデータ） (2023-09-12T08:52:56Z)
Break-It-Fix-It: Unsupervised Learning for Program Repair [90.55497679266442]
我々は2つの重要なアイデアを持つ新しいトレーニング手法であるBreak-It-Fix-It (BIFI)を提案する。批判者は、実際の悪い入力でフィクスダーの出力をチェックし、トレーニングデータに良い(固定された)出力を追加する。これらのアイデアに基づいて、よりペア化されたデータを生成するために、ブレーカとフィクスチャを同時に使用しながら、繰り返し更新する。 BIFIは既存のメソッドより優れており、GitHub-Pythonで90.5%、DeepFixで71.7%の修正精度がある。
論文参考訳（メタデータ） (2021-06-11T20:31:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。