論文の概要: STEAM: Simulating the InTeractive BEhavior of ProgrAMmers for Automatic
Bug Fixing
- arxiv url: http://arxiv.org/abs/2308.14460v1
- Date: Mon, 28 Aug 2023 09:56:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 12:13:25.303543
- Title: STEAM: Simulating the InTeractive BEhavior of ProgrAMmers for Automatic
Bug Fixing
- Title(参考訳): STEAM:自動バグ修正のためのプログラマーの非活性挙動のシミュレーション
- Authors: Yuwei Zhang and Zhi Jin and Ying Xing and Ge Li
- Abstract要約: 我々は、バグ解決の協調性をシミュレートするSTEAMという新しいステージワイドフレームワークを紹介した。
バグ修正タスクを,バグ報告,バグ診断,パッチ生成,パッチ検証の4つのステージに分割する。
広く採用されているバグフィックスベンチマークによる評価は、STEAMが最新のバグフィックス性能を新たに達成したことを示している。
- 参考スコア(独自算出の注目度): 37.70518599085676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bug fixing holds significant importance in software development and
maintenance. Recent research has made notable progress in exploring the
potential of large language models (LLMs) for automatic bug fixing. However,
existing studies often overlook the collaborative nature of bug resolution,
treating it as a single-stage process. To overcome this limitation, we
introduce a novel stage-wise framework named STEAM in this paper. The objective
of STEAM is to simulate the interactive behavior of multiple programmers
involved in various stages across the bug's life cycle. Taking inspiration from
bug management practices, we decompose the bug fixing task into four distinct
stages: bug reporting, bug diagnosis, patch generation, and patch verification.
These stages are performed interactively by LLMs, aiming to imitate the
collaborative abilities of programmers during the resolution of software bugs.
By harnessing the collective contribution, STEAM effectively enhances the
bug-fixing capabilities of LLMs. We implement STEAM by employing the powerful
dialogue-based LLM -- ChatGPT. Our evaluation on the widely adopted bug-fixing
benchmark demonstrates that STEAM has achieved a new state-of-the-art level of
bug-fixing performance.
- Abstract(参考訳): バグ修正はソフトウェア開発とメンテナンスにおいて非常に重要である。
最近の研究は、自動バグ修正のための大規模言語モデル(LLM)の可能性を探究している。
しかし、既存の研究はバグ解決の協調性を見落とし、単一段階のプロセスとして扱うことが多い。
本稿では,この制限を克服するために,STEAMという新たなステージワイドフレームワークを紹介する。
STEAMの目的は、バグのライフサイクルの様々な段階に関わる複数のプログラマのインタラクティブな振る舞いをシミュレートすることである。
バグ管理のプラクティスからインスピレーションを得て、バグ修正タスクを、バグレポート、バグ診断、パッチ生成、パッチ検証の4つのステージに分割します。
これらのステージはLLMによってインタラクティブに実行され、ソフトウェアバグの解決時にプログラマの協調能力を模倣することを目的としている。
コントリビューションの活用により、STEAMはLLMのバグ修正機能を効果的に強化する。
我々は,強力な対話型LLM-ChatGPTを用いてSTEAMを実装した。
広く採用されているバグフィックスベンチマークによる評価は、STEAMが最新のバグフィックス性能を新たに達成したことを示している。
関連論文リスト
- LLMs as Continuous Learners: Improving the Reproduction of Defective Code in Software Issues [62.12404317786005]
EvoCoderは、イシューコード再現のための継続的学習フレームワークである。
その結果,既存のSOTA法よりも20%改善した。
論文 参考訳(メタデータ) (2024-11-21T08:49:23Z) - MarsCode Agent: AI-native Automated Bug Fixing [7.909344108948294]
MarsCode Agentは、大規模な言語モデルを利用して、ソフトウェアコードのバグを自動的に識別し、修復する新しいフレームワークである。
提案手法は, 計画, バグ再現, 障害局所化, パッチの候補生成, バリデーションといった, 高品質なバグ修正を確実にするための体系的なプロセスに従う。
以上の結果から,MarsCode Agentは既存の自動化アプローチと比較して,バグ修正において高い成功率を達成していることがわかった。
論文 参考訳(メタデータ) (2024-09-02T02:24:38Z) - A Deep Dive into Large Language Models for Automated Bug Localization and Repair [12.756202755547024]
大規模言語モデル(LLM)は、自動プログラム修復(APR)など、様々なソフトウェアエンジニアリングタスクにおいて顕著な効果を示している。
本研究では,LSMを用いた自動バグ修正について深く検討する。
異なるLLMを用いてバグの局所化と修正を分離することにより、多様なコンテキスト情報の効果的な統合が可能になる。
Toggleは、CodeXGLUEコード改善ベンチマークで、新しい最先端(SOTA)パフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-04-17T17:48:18Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - Automated Bug Generation in the era of Large Language Models [6.0770779409377775]
BugFarmは任意のコードを複数の複雑なバグに変換する。
BUGFARMが生成した1.9万以上の変異株から435k以上のバグを総合的に評価する。
論文 参考訳(メタデータ) (2023-10-03T20:01:51Z) - Prompting Is All You Need: Automated Android Bug Replay with Large Language Models [28.69675481931385]
本稿では,バグ報告から迅速なエンジニアリングを通じてバグを自動的に再現する,新しい軽量なアプローチであるAdbGPTを提案する。
AdbGPTは、LLMから人間の知識と論理的推論を引き出すために、少数ショットの学習と連鎖推論を活用する。
この評価は,253.6秒で81.3%のバグレポートを再現するAdbGPTの有効性と有効性を示すものである。
論文 参考訳(メタデータ) (2023-06-03T03:03:52Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - ADPTriage: Approximate Dynamic Programming for Bug Triage [0.0]
オンラインバグトリアージタスクのためのマルコフ決定プロセス(MDP)モデルを開発した。
私たちはADPTriageと呼ばれるADPベースのバグトリアージソリューションを提供しています。
以上の結果から, 代入精度と固定時間の観点から, ミオピックアプローチよりも有意な改善が見られた。
論文 参考訳(メタデータ) (2022-11-02T04:42:21Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - Off-Beat Multi-Agent Reinforcement Learning [62.833358249873704]
オフビート動作が一般的環境におけるモデルフリーマルチエージェント強化学習(MARL)について検討した。
モデルレスMARLアルゴリズムのための新しいエピソードメモリLeGEMを提案する。
我々は,Stag-Hunter Game,Quarry Game,Afforestation Game,StarCraft IIマイクロマネジメントタスクなど,オフビートアクションを伴うさまざまなマルチエージェントシナリオ上でLeGEMを評価する。
論文 参考訳(メタデータ) (2022-05-27T02:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。