Fugu-MT 論文翻訳(概要): SWE-Exp: Experience-Driven Software Issue Resolution

論文の概要: SWE-Exp: Experience-Driven Software Issue Resolution

arxiv url: http://arxiv.org/abs/2507.23361v1
Date: Thu, 31 Jul 2025 09:13:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-01 17:19:09.41013
Title: SWE-Exp: Experience-Driven Software Issue Resolution
Title（参考訳）: SWE-Exp: エクスペリエンス駆動のソフトウェア問題解決
Authors: Silin Chen, Shaoxin Lin, Xiaodong Gu, Yuling Shi, Heng Lian, Longfei Yun, Dong Chen, Weiguo Sun, Lin Cao, Qianxiang Wang,
Abstract要約: SWE-Expは, 従来のエージェント軌跡から簡潔で実用的な体験を抽出する, 改良されたアプローチである。本手法では, 修復と修復の失敗の両方を捉えた多面的経験バンクを提案する。実験の結果、SWE-ExpはSWE-bench-Verified上で最先端の解像度(41.6% Pass@1)を達成することがわかった。
参考スコア（独自算出の注目度）: 19.525080502900785
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in large language model (LLM) agents have shown remarkable progress in software issue resolution, leveraging advanced techniques such as multi-agent collaboration and Monte Carlo Tree Search (MCTS). However, current agents act as memoryless explorers - treating each problem separately without retaining or reusing knowledge from previous repair experiences. This leads to redundant exploration of failed trajectories and missed chances to adapt successful issue resolution methods to similar problems. To address this problem, we introduce SWE-Exp, an experience - enhanced approach that distills concise and actionable experience from prior agent trajectories, enabling continuous learning across issues. Our method introduces a multi-faceted experience bank that captures both successful and failed repair attempts. Specifically, it extracts reusable issue resolution knowledge at different levels - from high-level problem comprehension to specific code changes. Experiments show that SWE-Exp achieves state-of-the-art resolution rate (41.6% Pass@1) on SWE-bench-Verified under open-source agent frameworks. Our approach establishes a new paradigm in which automated software engineering agents systematically accumulate and leverage repair expertise, fundamentally shifting from trial-and-error exploration to strategic, experience-driven issue resolution.
Abstract（参考訳）: 大規模言語モデル(LLM)エージェントの最近の進歩は、マルチエージェントコラボレーションやモンテカルロ木探索(MCTS)といった高度な技術を活用し、ソフトウェア問題解決の著しい進歩を示している。しかし、現在のエージェントはメモリレスエクスプローラーとして働き、以前の修復経験から知識を保持したり再利用したりすることなく、それぞれの問題を別々に扱う。これは失敗した軌道の冗長な探索につながり、同じ問題に問題解決手法をうまく適応させる機会を逃した。この問題に対処するために,従来のエージェントトラジェクトリから簡潔で実行可能なエクスペリエンスを蒸留し,課題をまたいだ継続的学習を可能にする,SWE-Expを導入する。本手法では, 修復と修復の失敗の両方を捉えた多面的経験バンクを提案する。具体的には、高レベルの問題理解から特定のコード変更に至るまで、さまざまなレベルで再利用可能な課題解決の知識を抽出します。実験の結果、SWE-Expはオープンソースのエージェントフレームワークの下でSWE-bench-Verified上で、最先端の解決レート(41.6% Pass@1)を達成することが示された。我々のアプローチは、自動化されたソフトウェアエンジニアリングエージェントが、修復の専門知識を体系的に蓄積し、活用する新しいパラダイムを確立します。

関連論文リスト

SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [43.74003959397812]
大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳（メタデータ） (2025-08-04T05:51:55Z)
Trae Agent: An LLM-based Agent for Software Engineering with Test-time Scaling [18.390443362388623]
Trae Agentは、リポジトリレベルのイシュー解決のための、最初のエージェントベースのアンサンブル推論アプローチである。広範に評価されたSWEベンチマークにおいて,3つの主要な大規模言語モデル(LLM)を用いて実験を行った。 Trae Agentは、Pass@1の観点で、すべてのベースラインに対して平均10.22%の改善で、一貫して優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (2025-07-31T09:37:22Z)
Co-Saving: Resource Aware Multi-Agent Collaboration for Software Development [65.94639060883475]
本稿では,リソースを意識したマルチエージェントシステムであるCo-Savingを提案する。私たちの重要なイノベーションは、"ショートカット"の導入です。最先端のMAS ChatDevと比較して,トークン使用量の平均50.85%の削減を実現している。
論文参考訳（メタデータ） (2025-05-28T02:23:53Z)
LLMs as Continuous Learners: Improving the Reproduction of Defective Code in Software Issues [62.12404317786005]
EvoCoderは、イシューコード再現のための継続的学習フレームワークである。その結果,既存のSOTA法よりも20%改善した。
論文参考訳（メタデータ） (2024-11-21T08:49:23Z)
Synergistic Multi-Agent Framework with Trajectory Learning for Knowledge-Intensive Tasks [44.42989163847349]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて大きなブレークスルーをもたらした。知識集約的なシナリオにおいて、現実的に一貫した応答を生成することは、依然として課題である。本稿では,LSM生成応答の解釈可能性と現実的一貫性を高めるために,外部知識を活用する新しいマルチエージェントフレームワークSMARTを紹介する。
論文参考訳（メタデータ） (2024-07-13T13:58:24Z)
Iterative Experience Refinement of Software-Developing Agents [81.09737243969758]
大規模な言語モデル(LLM)は、過去の経験を活用してエラーを低減し、効率を高めることができる。本稿では,LLMエージェントがタスク実行中に反復的に経験を洗練できる反復体験精錬フレームワークを提案する。
論文参考訳（メタデータ） (2024-05-07T11:33:49Z)
Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文参考訳（メタデータ） (2023-12-28T13:50:42Z)
ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent [50.508669199496474]
外部知識に基づいて推論と行動を行うReAct-style LLMエージェントを開発した。エージェントをReSTライクな手法で改良し,従来の軌道上で反復的に訓練する。引き起こされた大きなモデルから始まり、アルゴリズムのたった2イテレーションの後に、微調整された小さなモデルを生成することができる。
論文参考訳（メタデータ） (2023-12-15T18:20:15Z)
ExpeL: LLM Agents Are Experiential Learners [57.13685954854463]
実験学習エージェント(ExpeL)を導入し、パラメトリック更新を必要とせずにエージェント体験から学習できるようにする。我々のエージェントは、経験を自律的に収集し、学習課題の集合から自然言語を用いて知識を抽出する。推論において、エージェントは抽出された洞察と過去の経験をリコールし、情報的決定を行う。
論文参考訳（メタデータ） (2023-08-20T03:03:34Z)
KnowRU: Knowledge Reusing via Knowledge Distillation in Multi-agent Reinforcement Learning [16.167201058368303]
深層強化学習(RL)アルゴリズムはマルチエージェント領域において劇的に進歩している。この問題を解決するには、歴史的経験の効率的な活用が不可欠です。知識再利用のための「KnowRU」という手法を提案する。
論文参考訳（メタデータ） (2021-03-27T12:38:01Z)
Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。 Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文参考訳（メタデータ） (2020-05-12T17:59:45Z)
On Solving Cooperative MARL Problems with a Few Good Experiences [8.596915685049511]
協調型マルチエージェント強化学習(MARL)は,協調型分散型意思決定学習において重要である。捜索と救助、ドローンの監視、荷物の配達、消防戦といった多くの領域において、重要な課題は、いくつかの良い経験から学ぶことだ。非定常性と疎結合な良好な経験を同時に扱える新しい架空の自己模倣手法を提供する。
論文参考訳（メタデータ） (2020-01-22T12:53:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。