論文の概要: RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring
- arxiv url: http://arxiv.org/abs/2511.03153v1
- Date: Wed, 05 Nov 2025 03:20:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.313375
- Title: RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring
- Title(参考訳): RefAgent: 自動ソフトウェアリファクタリングのためのマルチエージェントLCMベースのフレームワーク
- Authors: Khouloud Oueslati, Maxime Lamothe, Foutse Khomh,
- Abstract要約: RefAgentは、エンドツーエンドソフトウェアのためのマルチエージェントLLMベースのフレームワークである。
テストの計画、実行、反復的な精錬を担当する特殊なエージェントで構成されています。
単体テストの合格率は90%で、コードの臭いを52.5%減らし、キーの品質特性を8.6%改善している。
- 参考スコア(独自算出の注目度): 8.038518812060897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have substantially influenced various software engineering tasks. Indeed, in the case of software refactoring, traditional LLMs have shown the ability to reduce development time and enhance code quality. However, these LLMs often rely on static, detailed instructions for specific tasks. In contrast, LLM-based agents can dynamically adapt to evolving contexts and autonomously make decisions by interacting with software tools and executing workflows. In this paper, we explore the potential of LLM-based agents in supporting refactoring activities. Specifically, we introduce RefAgent, a multi-agent LLM-based framework for end-to-end software refactoring. RefAgent consists of specialized agents responsible for planning, executing, testing, and iteratively refining refactorings using self-reflection and tool-calling capabilities. We evaluate RefAgent on eight open-source Java projects, comparing its effectiveness against a single-agent approach, a search-based refactoring tool, and historical developer refactorings. Our assessment focuses on: (1) the impact of generated refactorings on software quality, (2) the ability to identify refactoring opportunities, and (3) the contribution of each LLM agent through an ablation study. Our results show that RefAgent achieves a median unit test pass rate of 90%, reduces code smells by a median of 52.5%, and improves key quality attributes (e.g., reusability) by a median of 8.6%. Additionally, it closely aligns with developer refactorings and the search-based tool in identifying refactoring opportunities, attaining a median F1-score of 79.15% and 72.7%, respectively. Compared to single-agent approaches, RefAgent improves the median unit test pass rate by 64.7% and the median compilation success rate by 40.1%. These findings highlight the promise of multi-agent architectures in advancing automated software refactoring.
- Abstract(参考訳): 大規模言語モデル(LLM)は、様々なソフトウェアエンジニアリングタスクに大きく影響している。
実際、ソフトウェアリファクタリングの場合、従来のLLMは開発時間を短縮し、コード品質を向上させる能力を示しています。
しかしながら、これらのLSMは、しばしば特定のタスクに対して静的で詳細な命令に依存している。
対照的に、LLMベースのエージェントは、進化するコンテキストに動的に適応し、ソフトウェアツールと対話してワークフローを実行することで、自律的に意思決定することができる。
本稿では,LLMをベースとしたエージェントがリファクタリング活動を支援する可能性について検討する。
具体的には、エンドツーエンドのソフトウェアリファクタリングのためのマルチエージェントLLMベースのフレームワークであるRefAgentを紹介します。
RefAgentは、セルフリフレクションとツール呼び出し機能を使用してリファクタリングを計画、実行、テスト、反復的に精錬する特殊なエージェントで構成されている。
我々はRefAgentを8つのオープンソースプロジェクトで評価し、その効果をシングルエージェントアプローチ、検索ベースのリファクタリングツール、歴史的な開発者リファクタリングと比較した。
本評価は,(1) 生成したリファクタリングがソフトウェアの品質に与える影響,(2) リファクタリングの機会を識別する能力,(3) アブレーション研究による各LLMエージェントの貢献などに着目した。
以上の結果から,RefAgentの単位試験合格率は90%,コードの臭いは52.5%,キー品質特性(再利用性など)は8.6%向上した。
さらに、リファクタリングの機会を識別する上で、開発者リファクタリングと検索ベースのツールと密接に一致し、それぞれ79.15%と72.7%という中央値のF1スコアを達成した。
シングルエージェントのアプローチと比較して、RefAgentは中央値の単体テストパス率を64.7%改善し、中央値のコンパイル成功率を40.1%改善した。
これらの結果は、自動ソフトウェアリファクタリングの進歩におけるマルチエージェントアーキテクチャの約束を浮き彫りにしている。
関連論文リスト
- LLM-based Multi-Agent System for Intelligent Refactoring of Haskell Code [3.8442921307218882]
Haskell コード上での処理を自動化するために,大規模言語モデル (LLM) ベースのマルチエージェントシステムを提案する。
その結果、提案したマルチエージェントシステムは、コードの複雑さを平均11.03%減少させ、コード品質を22.46%改善し、パフォーマンス効率を平均13.27%向上させることができた。
論文 参考訳(メタデータ) (2025-06-24T10:17:34Z) - R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science [70.1638335489284]
高レベルの機械学習エンジニアリングタスクは、労働集約的で反復的である。
機械学習プロセスを形式化する包括的で分離されたフレームワークであるR&D-Agentを紹介します。
R&D-AgentはMLEを2つのフェーズと6つのコンポーネントに定義し、MLEのエージェント設計を原則としてテスト可能なプロセスに変える。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - MANTRA: Enhancing Automated Method-Level Refactoring with Contextual RAG and Multi-Agent LLM Collaboration [44.75848695076576]
本稿では,包括的Large Language ModelsエージェントベースのフレームワークであるMANTRAを紹介する。
ManTRAは、コンテキスト対応検索強化生成、協調型マルチエージェントコラボレーション、および言語強化学習を統合している。
MANTRA はベースライン LLM モデルを大幅に上回ることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2025-03-18T15:16:51Z) - ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [53.817538122688944]
Reinforced Meta-thinking Agents (ReMA) を導入し,Large Language Models (LLMs) の推論からメタ思考行動を求める。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
単ターン実験による実験結果から、ReMAは複雑な推論タスクにおいて単エージェントRLベースラインよりも優れることが示された。
論文 参考訳(メタデータ) (2025-03-12T16:05:31Z) - Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.35348425288859]
RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文 参考訳(メタデータ) (2025-03-03T12:54:54Z) - An Empirical Study on the Potential of LLMs in Automated Software Refactoring [9.157968996300417]
自動ソフトウェアにおける大規模言語モデル(LLM)の可能性について検討する。
私たちは、ChatGPTが提案した176のソリューションのうち13と、Geminiが提案した137のソリューションのうち9が、ソースコードの機能を変更したり、構文エラーを導入したりすることを安全でないことに気付きました。
論文 参考訳(メタデータ) (2024-11-07T05:35:55Z) - Together We Go Further: LLMs and IDE Static Analysis for Extract Method Refactoring [9.882903340467815]
単一のメソッドに複数の責任をカプセル化する長いメソッドはメンテナンスが難しい。
大規模言語モデル(LLM)は、大規模なコードコーパスで訓練されている。
LLMは非常に効果的であるが、信頼できない。最大76.3%は幻覚である。
論文 参考訳(メタデータ) (2024-01-27T05:01:03Z) - AgentBench: Evaluating LLMs as Agents [99.12825098528212]
エージェントとしてのLarge Language Model (LLM)は近年広く認知されている。
我々は,LLM-as-Agentの推論と意思決定能力を評価するために,8つの異なる環境からなるベンチマークであるAgentBenchを提案する。
論文 参考訳(メタデータ) (2023-08-07T16:08:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。