論文の概要: Collaborative Agents for Automated Program Repair in Ruby
- arxiv url: http://arxiv.org/abs/2511.03925v1
- Date: Thu, 06 Nov 2025 00:00:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.244238
- Title: Collaborative Agents for Automated Program Repair in Ruby
- Title(参考訳): Rubyにおける自動プログラム修復のための協調エージェント
- Authors: Nikta Akbarpour, Mahdieh Sadat Benis, Fatemeh Hendijani Fard, Ali Ouni, Mohamed Aymen Saied,
- Abstract要約: 私たちは、フィードバック駆動で反復的なRubyのプロセスとしてプログラムの修復を定式化する、新しい軽量フレームワークであるRAMPを紹介します。
RAMPは、ターゲットテストを生成し、エラーを反映し、正しい解決策が見つかるまで候補修正を洗練する共同エージェントのチームを採用している。
XCodeEvalベンチマークの評価は、RAMPがRubyで67%のパス@1を達成することを示している。
- 参考スコア(独自算出の注目度): 3.4340409139870474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated Program Repair (APR) has advanced rapidly with Large Language Models (LLMs), but most existing methods remain computationally expensive, and focused on a small set of languages. Ruby, despite its widespread use in web development and the persistent challenges faced by its developers, has received little attention in APR research. In this paper, we introduce RAMP, a novel lightweight framework that formulates program repair as a feedback-driven, iterative process for Ruby. RAMP employs a team of collaborative agents that generate targeted tests, reflect on errors, and refine candidate fixes until a correct solution is found. Unlike prior approaches, RAMP is designed to avoid reliance on large multilingual repair databases or costly fine-tuning, instead operating directly on Ruby through lightweight prompting and test-driven feedback. Evaluation on the XCodeEval benchmark shows that RAMP achieves a pass@1 of 67% on Ruby, outper-forming prior approaches. RAMP converges quickly within five iterations, and ablation studies confirm that test generation and self-reflection are key drivers of its performance. Further analysis shows that RAMP is particularly effective at repairing wrong answers, compilation errors, and runtime errors. Our approach provides new insights into multi-agent repair strategies, and establishes a foundation for extending LLM-based debugging tools to under-studied languages.
- Abstract(参考訳): APR(Automated Program repair)は、LLM(Large Language Models)によって急速に進歩しているが、既存のほとんどの手法は計算に高価であり、少数の言語に重点を置いている。
Rubyは、Web開発で広く使われていることと、開発者が直面している永続的な課題にもかかわらず、APR研究ではほとんど注目を集めていない。
本稿では,Ruby のフィードバック駆動反復プロセスとしてプログラム修復を定式化する,新しい軽量フレームワークである RAMP を紹介する。
RAMPは、ターゲットテストを生成し、エラーを反映し、正しい解決策が見つかるまで候補修正を洗練する共同エージェントのチームを採用している。
従来のアプローチとは異なり、RAMPは大規模な多言語修復データベースへの依存やコストのかかる微調整を避けるために設計されており、代わりに軽量なプロンプトとテスト駆動のフィードバックを通じてRuby上で直接動作する。
XCodeEvalベンチマークの評価は、RAMPがRubyで67%のパス@1を達成することを示している。
RAMPは5回のイテレーションですぐに収束し、アブレーション研究はテスト生成と自己回帰がパフォーマンスの重要な要因であることを確認した。
さらなる分析によると、RAMPは特に間違った回答、コンパイルエラー、実行時のエラーの修正に有効である。
提案手法は,マルチエージェント修復戦略に関する新たな知見を提供し,LLMベースのデバッグツールを未学習言語に拡張するための基盤を確立する。
関連論文リスト
- InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。
対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文 参考訳(メタデータ) (2025-10-21T06:26:29Z) - MemoCoder: Automated Function Synthesis using LLM-Supported Agents [1.498158806172909]
我々は,過去の修正から協調的な問題解決と永続的な学習を可能にするフレームワークであるMemoCoderを提案する。
中央メンタエージェントは、繰り返し発生するエラーパターンを特定し、ハイレベルな修正戦略を精査することにより、修復プロセスを監督する。
実験の結果,MemoCoderはゼロショットプロンプトと自己修復戦略の両方を一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2025-07-24T21:23:44Z) - Repeton: Structured Bug Repair with ReAct-Guided Patch-and-Test Cycles [1.387448620257867]
大規模言語モデル(LLM)は、コード生成と理解において強力な能力を示しているが、複雑なソフトウェアエンジニアリングタスクへの応用は、しばしば低い精度と限定的な解釈可能性に悩まされている。
実世界のGitの正確かつ自動化されたコード操作にLLMを活用する、完全にオープンソースなフレームワークであるRepetonを紹介します。
論文 参考訳(メタデータ) (2025-06-09T19:36:40Z) - Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文 参考訳(メタデータ) (2025-05-23T08:23:36Z) - Towards Practical and Useful Automated Program Repair for Debugging [4.216808129651161]
PracAPRは統合開発環境(IDE)で動作する対話型修復システムである
PracAPRはテストスイートやプログラムの再実行を必要としない。
論文 参考訳(メタデータ) (2024-07-12T03:19:54Z) - A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。
1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文 参考訳(メタデータ) (2024-04-26T04:55:35Z) - Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization [103.70896967077294]
本稿では,レトロスペクティブモデルを学習することで,大規模言語エージェントを強化するための原則的枠組みを提案する。
提案するエージェントアーキテクチャは,事前学習した言語モデルを微調整するために,複数の環境やタスクにまたがる報酬から学習する。
様々なタスクの実験結果から、言語エージェントは時間とともに改善することが示された。
論文 参考訳(メタデータ) (2023-08-04T06:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。