論文の概要: RepoRepair: Leveraging Code Documentation for Repository-Level Automated Program Repair
- arxiv url: http://arxiv.org/abs/2603.01048v1
- Date: Sun, 01 Mar 2026 11:06:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.479132
- Title: RepoRepair: Leveraging Code Documentation for Repository-Level Automated Program Repair
- Title(参考訳): RepoRepair: リポジトリレベルの自動プログラム修復にコードドキュメンテーションを活用する
- Authors: Zhongqiang Pan, Chuanyi Li, Wenkang Zhong, Yi Feng, Bin Luo, Vincent Ng,
- Abstract要約: RepoRepairは,レポジトリレベルの障害ローカライゼーションとプログラム修復のための新しいドキュメンテーションによるアプローチである。
私たちの中核的な洞察は、LLMを活用して、コードリポジトリの階層的なコードドキュメンテーション(関数からファイルまで)を生成することです。
RepoRepairはまず、テキストベースのLLMを使用して、リポジトリのファイル/関数レベルのコードドキュメントを生成する。
- 参考スコア(独自算出の注目度): 30.23781155493087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated program repair (APR) struggles to scale from isolated functions to full repositories, as it demands a global, task-aware understanding to locate necessary changes. Current methods, limited by context and reliant on shallow retrieval or costly agent iterations, falter on complex cross-file issues. To this end, we propose RepoRepair, a novel documentation-enhanced approach for repository-level fault localization and program repair. Our core insight is to leverage LLMs to generate hierarchical code documentation (from functions to files) for code repositories, creating structured semantic abstractions that enable LLMs to comprehend repository-level context and dependencies. Specifically, RepoRepair first employs a text-based LLM (e.g., DeepSeek-V3) to generate file/function-level code documentation for repositories, which serves as auxiliary knowledge to guide fault localization. Subsequently, based on the fault localization results and the issue description, a powerful LLM (e.g., Claude-4) attempts to repair the identified suspicious code snippets. Evaluated on SWE-bench Lite, RepoRepair achieves a 45.7% repair rate at a low cost of $0.44 per fix. On SWE-bench Multimodal, it delivers state-of-the-art performance with a 37.1% repair rate despite a higher cost of $0.56 per fix, demonstrating robust and cost-effective performance across diverse problem domains.
- Abstract(参考訳): 自動プログラム修復(APR)は、必要な変更を見つけるために、グローバルでタスク対応の理解を必要とするため、独立した関数から完全なリポジトリへのスケールアップに苦労する。
現在のメソッドは、コンテキストによって制限され、浅い検索やコストのかかるエージェントのイテレーションに依存する。
この目的のために,レポジトリレベルのフォールトローカライゼーションとプログラム修復のための新しいドキュメンテーション強化アプローチであるRepoRepairを提案する。
私たちの中核的な洞察は、LLMを活用して、コードリポジトリの階層的なコードドキュメンテーション(関数からファイルまで)を生成し、LLMがリポジトリレベルのコンテキストと依存関係を理解できるように構造化されたセマンティック抽象化を作成することです。
具体的には、RepoRepairはまずテキストベースのLCM(例:DeepSeek-V3)を使用して、リポジトリのファイル/ファンクションレベルのコードドキュメントを生成する。
その後、フォールトローカライゼーション結果とイシュー記述に基づいて、強力なLCM(例えば、Claude-4)が特定された疑わしいコードスニペットの修復を試みる。
SWE-bench Liteで評価すると、RepoRepairは45.7%の修理率で1回の修正で0.44ドルである。
SWE-bench Multimodalでは、修正当たり0.56ドル高いコストにもかかわらず、37.1%の修復率で最先端のパフォーマンスを提供し、様々な問題領域で堅牢で費用対効果の高い性能を示す。
関連論文リスト
- SGAgent: Suggestion-Guided LLM-Based Multi-Agent Framework for Repository-Level Software Repair [22.745971570878435]
本稿では,リポジトリレベルのソフトウェア修復のためのSuggestion-Guided Multi-Agentフレームワークを提案する。
SGAgentは、局所化から修復への移行を強化するための提案段階を導入する。
3つの専門のサブエージェントが協力して、エンドツーエンドのソフトウェアの自動修復を実現します。
論文 参考訳(メタデータ) (2026-02-27T03:32:47Z) - Outcome-Conditioned Reasoning Distillation for Resolving Software Issues [49.16055123488827]
本稿では, 検証済みパッチを監督として, リポジトリ内問題を解決したO-CRD(Outcome-Conditioned Reasoning Distillation)フレームワークを提案する。
歴史的修正から始まり、検証結果から段階的な修理トレースを後方に再構築する。
SWE-Bench Liteでは、GPT-4oではPass@1が10.4%、DeepSeek-V3では8.6%、GPT-5では10.3%増加する。
論文 参考訳(メタデータ) (2026-01-30T18:25:39Z) - Repairing Regex Vulnerabilities via Localization-Guided Instructions [6.033257307910245]
正規表現(regexes)は、正規表現拒否(ReDoS)にシステムを公開する
しかし、現在のアプローチはトレードオフによって妨げられている。
信頼性を保ちながら一般化を活用するために設計されたハイブリッド・フレームワーク、ローカライズド・リフレクション(LRR)を導入する。
論文 参考訳(メタデータ) (2025-10-10T06:15:43Z) - RelRepair: Enhancing Automated Program Repair by Retrieving Relevant Code [11.74568238259256]
RelRepairは関連するプロジェクト固有のコードを取得し、プログラムの自動修復を強化する。
広く研究されている2つのデータセット、Defects4J V1.2 と ManySStuBs4J について RelRepair の評価を行った。
論文 参考訳(メタデータ) (2025-09-20T14:07:28Z) - RepoDebug: Repository-Level Multi-Task and Multi-Language Debugging Evaluation of Large Language Models [49.83481415540291]
LLM(Large Language Models)は、コードのデバッグに非常に熟練している。
本稿ではマルチタスクおよび多言語リポジトリレベルのコードデバッグデータセットであるRepo Debugを紹介する。
最高のパフォーマンスモデルである Claude 3.5 Sonnect は,リポジトリレベルのデバッグでは依然としてうまく動作しない。
論文 参考訳(メタデータ) (2025-09-04T10:13:21Z) - SweRank: Software Issue Localization with Code Ranking [109.3289316191729]
SweRankは、ソフトウェア問題ローカライゼーションのための効率的な検索と参照のためのフレームワークである。
パブリックなGitHubリポジトリからキュレートされた大規模なデータセットであるSweLocを構築します。
SweRankは最先端の性能を達成し、従来のランキングモデルとコストの高いエージェントベースシステムの両方より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-07T19:44:09Z) - Enhancing repository-level software repair via repository-aware knowledge graphs [13.747293341707563]
リポジトリレベルのソフトウェア修復は、問題記述とコードパッチの間のセマンティックギャップを埋める際の課題に直面します。
既存のアプローチは、大きな言語モデル(LLM)に依存しており、意味的曖昧さ、構造的文脈の限られた理解、推論能力の不足によって妨げられている。
本稿では,リポジトリアーティファクト(課題とプル要求)とエンティティ(ファイル,クラス,関数)を正確にリンクする新しいリポジトリ対応知識グラフ(KG)を提案する。
KGをマイニングした経路を利用する経路誘導補修機構により,説明とともに文脈情報を拡張することができる。
論文 参考訳(メタデータ) (2025-03-27T17:21:47Z) - ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - When Large Language Models Confront Repository-Level Automatic Program
Repair: How Well They Done? [13.693311241492827]
オープンソースリポジトリから124の典型的なリポジトリレベルのバグで構成される新しいベンチマークであるRepoBugsを紹介します。
GPT3.5を用いた予備実験では,RepoBugsの修復率は22.58%に過ぎなかった。
本稿では,リポジトリレベルのコード修復タスクに対して,より正確なコンテキストを提供するために,シンプルで普遍的なリポジトリレベルのコンテキスト抽出手法(RLCE)を提案する。
論文 参考訳(メタデータ) (2024-03-01T11:07:41Z) - ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文 参考訳(メタデータ) (2023-11-16T12:03:21Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。