論文の概要: Enhancing Software Engineering Through Closed-Loop Memory Optimization
- arxiv url: http://arxiv.org/abs/2606.05646v1
- Date: Thu, 04 Jun 2026 03:17:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.520338
- Title: Enhancing Software Engineering Through Closed-Loop Memory Optimization
- Title(参考訳): クローズドループメモリ最適化によるソフトウェアエンジニアリングの強化
- Authors: Xuehang Guo, Zora Zhiruo Wang, Qingyun Wang, Graham Neubig, Xingyao Wang,
- Abstract要約: ソフトウェア工学 (SE) エージェントにおけるメモリ拡張のためのクローズドループフレームワークである ours を紹介する。
タスクに依存しない textbf ベンチマークとアノテーションのない textbf 最適化信号としての有用性を確立する。
その結果、SEエージェントは設定によって常に改善され、成功率で$uparrow5.25%、解決効率で$uparrow4.63%という絶対的なゲインが得られることが示された。
- 参考スコア(独自算出の注目度): 50.418699819003486
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have enabled powerful software engineering (SE) agents capable of navigating complex codebases and resolving real-world issues. However, these agents remain fundamentally episodic: they fail to retain, refine, and reuse experiences across tasks, repeatedly reconstructing context from scratch and reproducing similar mistakes. Even with memory support, they offer no remedy for the absence of a principled, task-agnostic \textit{memory utility}, making them difficult to evaluate rigorously or generalize across agents and settings. To tackle these limitations, we introduce \ours, a closed-loop framework for memory augmentation in SE agents. \ours grounds memory utility in \textit{validated downstream impact}, establishing utility as both a task-agnostic \textbf{evaluation benchmark} and an annotation-free \textbf{optimization signal}. Through complementary evaluation on \textit{single-episode} and \textit{cross-episode} memory augmentation, results demonstrate that \ours consistently improves SE agents across settings, achieving absolute gains of up to $\uparrow5.25\%$ in success rate and $\uparrow4.63\%$ in resolve efficiency, while substantially reducing computational cost by $\geq9.79\%$. Our project page: \href{https://xhguo7.github.io/MemOp/}{https://xhguo7.github.io/MemOp/}.
- Abstract(参考訳): 大規模言語モデル(LLM)は、複雑なコードベースをナビゲートし、現実世界の問題を解決する強力なソフトウェアエンジニアリング(SE)エージェントを可能にした。
しかし、これらのエージェントは基本的にエピソード的であり、タスク全体にわたる経験を維持し、洗練し、再利用することができず、コンテキストをスクラッチから繰り返し再構築し、同様の間違いを再現する。
メモリサポートがあっても、基本的なタスクに依存しない \textit{Memory utility} が存在しないため、エージェントや設定を厳格に評価したり一般化したりすることは困難である。
これらの制限に対処するため、SEエージェントのメモリ拡張のためのクローズドループフレームワークであるShaoursを紹介した。
タスクに依存しない \textbf{evaluation benchmark} とアノテーションのない \textbf{optimization signal} の両方としてユーティリティを確立する。
結果として、 \ours は textit{single-episode} と \textit{cross-episode} のメモリ拡張による相補的評価により、セッティング全体の SE エージェントを一貫して改善し、成功率$\uparrow5.25\%$と$\uparrow4.63\%$の絶対的なゲインを達成し、計算コストを$\geq9.79\%$に大幅に削減することを示した。
プロジェクトページ: \href{https://xhguo7.github.io/MemOp/}{https://xhguo7.github.io/MemOp/}。
関連論文リスト
- NextMem: Towards Latent Factual Memory for LLM-based Agents [58.35585202907478]
NextMemは、自動回帰型オートエンコーダを使用して、潜時メモリを効率的に構築する、潜時ファクトメモリフレームワークである。
大規模な実験は、NextMemが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-26T14:35:27Z) - AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents [26.029549618318086]
本稿では,長期対話における問題に対処する構造化メモリシステムであるAriadneMemを提案する。
AriadneMem は textbfMulti-Hop F1 を 15.2% 改善し, textbfAverage F1 を 9.0 % 改善したことを示す。
グラフ層への推論をオフロードすることで、AriadneMemはtextbf497コンテキストトークンのみを使用して、textbftotalランタイムを77.8%削減する。
論文 参考訳(メタデータ) (2026-02-05T22:19:31Z) - Remember Me, Refine Me: A Dynamic Procedural Memory Framework for Experience-Driven Agent Evolution [52.76038908826961]
我々は静的ストレージと動的推論のギャップを埋めるため、$textbfReMe$ ($textitRemember Me, Refine Me$)を提案する。
ReMeは3つのメカニズムを通じてメモリライフサイクルを革新する: $textitmulti-faceted distillation$, きめ細かい経験を抽出する。
BFCL-V3とAppWorldの実験では、ReMeが新しい最先端のエージェントメモリシステムを確立している。
論文 参考訳(メタデータ) (2025-12-11T14:40:01Z) - FRUGAL: Memory-Efficient Optimization by Reducing State Overhead for Scalable Training [51.39495282347475]
我々は、新しいメモリ効率最適化フレームワークであるtextbfF$ull-$textbfR$ank $textbfU$pdates with $textbfG$r$textbfA$dient sp$textbfL$ittingを紹介します。
当社のフレームワークは,GaLoreやBAdamなど,さまざまな低ランク更新選択技術と統合することが可能です。
論文 参考訳(メタデータ) (2024-11-12T14:41:07Z) - Infant Agent: A Tool-Integrated, Logic-Driven Agent with Cost-Effective API Usage [19.54437582630868]
textscInfant Agentはタスク認識機能、演算子、階層型管理システム、メモリ検索機構を統合する。
textscInfant Agentを使用すると、GPT-4oのSWE-bench-liteデータセットの精度は$mathbf0.33%$から$mathbf30%$に上昇し、AIME-2024数学コンペティションでは、GPT-4oの精度は$mathbf13.3%$から$mathbf37%$に上昇する。
論文 参考訳(メタデータ) (2024-11-02T02:48:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。