Fugu-MT 論文翻訳(概要): Bridging Bug Localization and Issue Fixing: A Hierarchical Localization Framework Leveraging Large Language Models

論文の概要: Bridging Bug Localization and Issue Fixing: A Hierarchical Localization Framework Leveraging Large Language Models

arxiv url: http://arxiv.org/abs/2502.15292v1
Date: Fri, 21 Feb 2025 08:37:02 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-24 23:44:09.976632
Title: Bridging Bug Localization and Issue Fixing: A Hierarchical Localization Framework Leveraging Large Language Models
Title（参考訳）: ブリッジングバグのローカライゼーションと問題修正:大規模言語モデルを活用する階層的なローカライゼーションフレームワーク
Authors: Jianming Chang, Xin Zhou, Lulu Wang, David Lo, Bixin Li,
Abstract要約: 本稿では、3つのカスタマイズされた大言語モデルを利用した最初の階層型バグローカライズフレームワークであるBugCerberusについて述べる。まず、BugCerberusはファイル、関数、ステートメントレベルでバグ関連プログラムの中間表現を分析し、その表現からバグ関連コンテキスト情報を抽出する。次に、BugCerberus氏は、バグレポートとコンテキストを使用して、各レベルで3つのカスタマイズされたLLMを設計し、バグのパターンを学習する。最後に、BugCerberusは3つのレベルでバグをローカライズするために、よく調整されたモデルを通してバグ関連コード要素を階層的に検索する。
参考スコア（独自算出の注目度）: 10.798803883293932
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automated issue fixing is a critical task in software debugging and has recently garnered significant attention from academia and industry. However, existing fixing techniques predominantly focus on the repair phase, often overlooking the importance of improving the preceding bug localization phase. As a foundational step in issue fixing, bug localization plays a pivotal role in determining the overall effectiveness of the entire process. To enhance the precision of issue fixing by accurately identifying bug locations in large-scale projects, this paper presents BugCerberus, the first hierarchical bug localization framework powered by three customized large language models. First, BugCerberus analyzes intermediate representations of bug-related programs at file, function, and statement levels and extracts bug-related contextual information from the representations. Second, BugCerberus designs three customized LLMs at each level using bug reports and contexts to learn the patterns of bugs. Finally, BugCerberus hierarchically searches for bug-related code elements through well-tuned models to localize bugs at three levels. With BugCerberus, we further investigate the impact of bug localization on the issue fixing. We evaluate BugCerberus on the widely-used benchmark SWE-bench-lite. The experimental results demonstrate that BugCerberus outperforms all baselines. Specifically, at the fine-grained statement level, BugCerberus surpasses the state-of-the-art in Top-N (N=1, 3, 5, 10) by 16.5%, 5.4%, 10.2%, and 23.1%, respectively. Moreover, in the issue fixing experiments, BugCerberus improves the fix rate of the existing issue fixing approach Agentless by 17.4% compared to the best baseline, highlighting the significant impact of enhanced bug localization on automated issue fixing.
Abstract（参考訳）: 自動イシューフィックスは、ソフトウェアデバッグにおいて重要なタスクであり、最近、アカデミックや業界から大きな注目を集めている。しかし、既存の修正技術は主に修復フェーズに焦点を合わせており、多くの場合、前のバグローカライゼーションフェーズを改善することの重要性を見落としている。問題修正の基本的なステップとして、バグのローカライゼーションは、プロセス全体の全体的な有効性を決定する上で、重要な役割を担います。本稿では,大規模プロジェクトにおけるバグ位置を正確に同定し,問題修正の精度を高めるために,3つのカスタマイズされた大規模言語モデルを用いた最初の階層型バグローカライズフレームワークであるBugCerberusを提案する。まず、BugCerberusはファイル、関数、ステートメントレベルでバグ関連プログラムの中間表現を分析し、その表現からバグ関連コンテキスト情報を抽出する。次に、BugCerberus氏は、バグレポートとコンテキストを使用して、各レベルで3つのカスタマイズされたLLMを設計し、バグのパターンを学習する。最後に、BugCerberusは3つのレベルでバグをローカライズするために、よく調整されたモデルを通してバグ関連コード要素を階層的に検索する。 BugCerberusでは、バグのローカライゼーションが問題修正に与える影響をさらに調査する。我々は広く使われているベンチマークSWE-bench-liteを用いてBugCerberusを評価した。実験の結果、BugCerberusはすべてのベースラインより優れていた。具体的には、粒度の細かい文では、BugCerberusはTop-N(N=1, 3, 5, 10)の16.5%、5.4%、10.2%、23.1%をそれぞれ上回っている。さらに、問題修正実験では、BugCerberusは最高のベースラインに比べて既存の問題修正アプローチの修正率を17.4%向上させ、自動問題修正に対するバグローカライゼーションの強化による大きな影響を強調している。

関連論文リスト

Bug Priority Change Prediction: An Exploratory Study on Apache Software [7.264561489832595]
本稿では,バグ修正の進化的特徴とクラス不均衡処理戦略に基づく2段階バグレポート優先度変更予測手法を提案する。提案手法の性能を評価するため,32の非自明なApacheプロジェクトから構築したバグデータセットを用いて実験を行った。
論文参考訳（メタデータ） (2025-12-10T00:59:51Z)
BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。難易度および多種多様なバグを合成する新しい方法を提案する。
論文参考訳（メタデータ） (2025-10-22T17:58:56Z)
Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。 AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文参考訳（メタデータ） (2025-09-29T18:20:27Z)
Improved IR-based Bug Localization with Intelligent Relevance Feedback [2.9312156642007294]
ソフトウェアバグは、開発とメンテナンスにおいて重大な課題となり、実践者は、バグを扱うのに約50%の時間を費やします。既存の多くのテクニックでは、バグレポートとソースコードの間のテキストおよび意味的関連性を使用して、報告されたバグをローカライズするために、Information Retrieval (IR)を採用している。本稿では,バグレポートとコードの関連性を評価することによって,コンテキストギャップに対処する新たなバグローカライゼーション手法であるBRaInを提案する。
論文参考訳（メタデータ） (2025-01-17T20:29:38Z)
BLAZE: Cross-Language and Cross-Project Bug Localization via Dynamic Chunking and Hard Example Learning [1.9854146581797698]
BLAZEは動的チャンキングとハードサンプル学習を採用するアプローチである。プロジェクト横断と言語横断のバグローカライゼーションを強化するために、難しいバグケースを使用してGPTベースのモデルを微調整する。 BLAZEは、トップ1の精度で120%、平均平均精度(MAP)で144%、平均相互ランク(MRR)で100%上昇する。
論文参考訳（メタデータ） (2024-07-24T20:44:36Z)
Leveraging Stack Traces for Spectrum-based Fault Localization in the Absence of Failing Tests [44.13331329339185]
我々は,スタックトレースデータをテストカバレッジと統合し,障害局所化を強化する新しいアプローチであるSBESTを導入する。提案手法では,平均精度(MAP)が32.22%向上し,平均相互ランク(MRR)が17.43%向上した。
論文参考訳（メタデータ） (2024-05-01T15:15:52Z)
DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。 C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文参考訳（メタデータ） (2024-01-09T15:46:38Z)
Automated Bug Generation in the era of Large Language Models [6.0770779409377775]
BugFarmは任意のコードを複数の複雑なバグに変換する。 BUGFARMが生成した1.9万以上の変異株から435k以上のバグを総合的に評価する。
論文参考訳（メタデータ） (2023-10-03T20:01:51Z)
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。 RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。 RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文参考訳（メタデータ） (2023-09-12T08:52:56Z)
WELL: Applying Bug Detectors to Bug Localization via Weakly Supervised Learning [37.09621161662761]
本稿では,バグローカライゼーションモデルをトレーニングするためのWEakly supervised bug LocaLization (WELL) 手法を提案する。 CodeBERTはバギーまたはノーのバイナリラベル付きデータに基づいて微調整されるため、WELLはバグのローカライゼーションを弱教師付きで解決することができる。
論文参考訳（メタデータ） (2023-05-27T06:34:26Z)
Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文参考訳（メタデータ） (2022-11-11T16:37:33Z)
ADPTriage: Approximate Dynamic Programming for Bug Triage [0.0]
オンラインバグトリアージタスクのためのマルコフ決定プロセス(MDP)モデルを開発した。私たちはADPTriageと呼ばれるADPベースのバグトリアージソリューションを提供しています。以上の結果から, 代入精度と固定時間の観点から, ミオピックアプローチよりも有意な改善が見られた。
論文参考訳（メタデータ） (2022-11-02T04:42:21Z)
BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文参考訳（メタデータ） (2022-07-21T20:17:53Z)
DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文参考訳（メタデータ） (2022-01-14T00:16:57Z)
Generating Bug-Fixes Using Pretrained Transformers [11.012132897417592]
実世界のgithubからマイニングしたjavaメソッドのバグの検出と修正を学ぶ,データ駆動型プログラム修復手法を導入する。ソースコードプログラムの事前トレーニングは,スクラッチからの教師ありトレーニングに比べて,33%のパッチ数を改善することを示す。我々は,標準精度評価基準を非削除および削除のみの修正に洗練し,我々の最良モデルが従来よりも75%多くの非削除修正を生成することを示す。
論文参考訳（メタデータ） (2021-04-16T05:27:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。