論文の概要: MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences
- arxiv url: http://arxiv.org/abs/2601.06789v1
- Date: Sun, 11 Jan 2026 06:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.987792
- Title: MemGovern: Enhancing Code Agents through Learning from Governed Human Experiences
- Title(参考訳): MemGovern: 人的経験から学ぶことによるコードエージェントの強化
- Authors: Qihao Wang, Ziming Cheng, Shuo Zhang, Fan Liu, Rui Xu, Heng Lian, Kunyi Wang, Xiaoming Yu, Jianghao Yin, Sen Hu, Yue Hu, Shaolei Zhang, Yanbing Liu, Ronghao Chen, Huacan Wang,
- Abstract要約: MemGovernは生のGitHubデータを管理し、エージェントの実行可能なメモリに変換するように設計されたフレームワークです。
MemGovernは経験管理を利用して、人間の経験をエージェントフレンドリーな体験カードに変換する。
MemGovernは大幅な性能向上を実現し、SWEベンチの解像度を4.65%向上させた。
- 参考スコア(独自算出の注目度): 46.856607652168556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While autonomous software engineering (SWE) agents are reshaping programming paradigms, they currently suffer from a "closed-world" limitation: they attempt to fix bugs from scratch or solely using local context, ignoring the immense historical human experience available on platforms like GitHub. Accessing this open-world experience is hindered by the unstructured and fragmented nature of real-world issue-tracking data. In this paper, we introduce MemGovern, a framework designed to govern and transform raw GitHub data into actionable experiential memory for agents. MemGovern employs experience governance to convert human experience into agent-friendly experience cards and introduces an agentic experience search strategy that enables logic-driven retrieval of human expertise. By producing 135K governed experience cards, MemGovern achieves a significant performance boost, improving resolution rates on the SWE-bench Verified by 4.65%. As a plug-in approach, MemGovern provides a solution for agent-friendly memory infrastructure.
- Abstract(参考訳): 自律ソフトウェアエンジニアリング(SWE)エージェントはプログラミングパラダイムを再構築しているが、現在は"クローズドワールド(closed-world)"の制限に悩まされている。
このオープンワールド体験へのアクセスは、現実世界の課題追跡データの構造化されていない、断片化された性質によって妨げられている。
本稿では,GitHubの生データをエージェントの実行可能なメモリに変換するためのフレームワークであるMemGovernを紹介する。
MemGovernは、経験をエージェントフレンドリーな体験カードに変換するために経験ガバナンスを採用し、人間の専門知識の論理駆動的な検索を可能にするエージェント体験検索戦略を導入した。
135Kのエクスペリエンスカードを生産することで、MemGovernは大幅な性能向上を実現し、SWEベンチの解像度を4.65%向上させた。
プラグインアプローチとして、MemGovernはエージェントフレンドリなメモリインフラストラクチャのソリューションを提供する。
関連論文リスト
- DataGovBench: Benchmarking LLM Agents for Real-World Data Governance Workflows [22.16698382751559]
大規模言語モデル(LLM)は、ユーザの意図をコードに変換することによって、データガバナンスを自動化するための有望なソリューションとして登場した。
既存の自動データサイエンスのベンチマークでは、スニペットレベルのコーディングや高レベルの分析が強調されることが多い。
データGovBenchは、実際のケースのデータに基づいて構築された、現実世界のシナリオに基盤を置く150の多様なタスクを特徴とするベンチマークです。
論文 参考訳(メタデータ) (2025-12-04T03:25:12Z) - LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - SWE-Exp: Experience-Driven Software Issue Resolution [19.525080502900785]
SWE-Expは, 従来のエージェント軌跡から簡潔で実用的な体験を抽出する, 改良されたアプローチである。
本手法では, 修復と修復の失敗の両方を捉えた多面的経験バンクを提案する。
実験の結果、SWE-ExpはSWE-bench-Verified上で最先端の解像度(41.6% Pass@1)を達成することがわかった。
論文 参考訳(メタデータ) (2025-07-31T09:13:42Z) - Git Context Controller: Manage the Context of LLM-based Agents like Git [6.521644491529639]
大きな言語モデル(LLM)ベースのエージェントは、内部推論と外部ツールの使用をインターリーブすることによって、印象的な機能を示している。
ソフトウェアバージョン管理システムにインスパイアされた構造化コンテキスト管理フレームワークであるGit-Context-Controller(GCC)を紹介した。
自己複製のケーススタディでは、GCCを増強したエージェントが新しいCLIエージェントをスクラッチから作り、40.7タスクの解決を実現した。
論文 参考訳(メタデータ) (2025-07-30T08:01:45Z) - Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving [62.71545696485824]
我々は,異種エージェントフレームワーク間のシームレスな体験共有を可能にするユニバーサルメモリ基盤であるAgent KBを紹介した。
Agent KBはトラジェクトリを構造化知識ベースに集約し、軽量APIを提供する。
我々は,GAIA,Humanity's Last Exam,GPQA,SWE-benchなどの主要フレームワークにまたがるエージェントを検証した。
論文 参考訳(メタデータ) (2025-07-08T17:59:22Z) - How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior [65.70584076918679]
メモリは、大きな言語モデル(LLM)ベースのエージェントにおいて重要なコンポーネントである。
本稿では,メモリ管理の選択がLLMエージェントの行動,特に長期的パフォーマンスに与える影響について検討する。
論文 参考訳(メタデータ) (2025-05-21T22:35:01Z) - Experiential Co-Learning of Software-Developing Agents [83.34027623428096]
大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。
本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。
実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文 参考訳(メタデータ) (2023-12-28T13:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。