論文の概要: MEMCoder: Multi-dimensional Evolving Memory for Private-Library-Oriented Code Generation
- arxiv url: http://arxiv.org/abs/2604.24222v1
- Date: Mon, 27 Apr 2026 09:27:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.877429
- Title: MEMCoder: Multi-dimensional Evolving Memory for Private-Library-Oriented Code Generation
- Title(参考訳): MEMCoder: プライベートライブラリ指向コード生成のための多次元進化メモリ
- Authors: Mofei Li, Taozhi Chen, Guowei Yang, Jia Li,
- Abstract要約: MEMCoderは、大規模言語モデルを自律的に蓄積し、利用ガイドラインを進化させることを可能にする新しいフレームワークである。
推論中、MEMCoderは静的ドキュメンテーションと関連する歴史的ガイドラインの両方をコンテキストに注入するために、デュアルソース検索メカニズムを使用している。
既存のメモリベースの連続学習法に比べて、ドメイン固有の適応性が非常に優れている。
- 参考スコア(独自算出の注目度): 7.313211974278645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) excel at general code generation, but their performance drops sharply in enterprise settings that rely on internal private libraries absent from public pre-training corpora. While Retrieval-Augmented Generation (RAG) offers a training-free alternative by providing static API documentation, we find that such documentation typically provides only isolated definitions, leaving a fundamental knowledge gap. Specifically, LLMs struggle with a task-level lack of coordination patterns between APIs and an API-level misunderstanding of parameter constraints and boundary conditions. To address this, we propose MEMCoder, a novel framework that enables LLMs to autonomously accumulate and evolve Usage Guidelines across these two dimensions. MEMCoder introduces a Multi-dimensional Evolving Memory that captures distilled lessons from the model's own problem-solving trajectories. During inference, MEMCoder employs a dual-source retrieval mechanism to inject both static documentation and relevant historical guidelines into the context. The framework operates in an automated closed loop by using objective execution feedback to reflect on successes and failures, resolve knowledge conflicts, and dynamically update memory. Extensive evaluations on the NdonnxEval and NumbaEval benchmarks demonstrate that MEMCoder substantially enhances existing RAG systems, yielding an average absolute pass@1 gain of 16.31%. Furthermore, MEMCoder exhibits vastly superior domain-specific adaptation compared to existing memory-based continual learning methods.
- Abstract(参考訳): LLM(Large Language Models)は、一般的なコード生成において優れているが、そのパフォーマンスは、公開事前学習コーパスから欠落した内部プライベートライブラリに依存するエンタープライズ環境で急速に低下する。
Retrieval-Augmented Generation(RAG)は、静的APIドキュメンテーションを提供することによって、トレーニング不要の代替手段を提供するが、そのようなドキュメンテーションは通常、独立した定義のみを提供し、基本的な知識ギャップを残している。
具体的には、API間の調整パターンのタスクレベルの欠如と、パラメータ制約と境界条件のAPIレベルの誤解に苦慮している。
そこで本研究では,この2つの次元にまたがってLCMを自律的に蓄積し,利用ガイドラインを進化させる新しいフレームワークであるMEMCoderを提案する。
MEMCoderは、モデル自身の問題解決トラジェクトリから抽出された教訓をキャプチャする多次元進化メモリを導入した。
推論中、MEMCoderは静的ドキュメンテーションと関連する歴史的ガイドラインの両方をコンテキストに注入するために、デュアルソース検索メカニズムを使用している。
このフレームワークは、客観的な実行フィードバックを使用して、成功と失敗を反映し、知識の衝突を解決し、メモリを動的に更新することで、自動クローズドループで動作する。
NdonnxEvalとNumbaEvalのベンチマークによる大規模な評価は、MEMCoderが既存のRAGシステムを大幅に強化し、平均的な絶対パス@1ゲイン16.31%が得られることを示している。
さらに、MEMCoderは、既存のメモリベースの連続学習法に比べて、ドメイン固有の適応性が非常に優れている。
関連論文リスト
- MemFactory: Unified Inference & Training Framework for Agent Memory [30.793092194488263]
MemFactoryは、メモリ拡張エージェント用に特別に設計された、最初の統合された、高度にモジュール化されたトレーニングおよび推論フレームワークである。
LLaMA-Factoryのような統合された微調整フレームワークの成功に触発されたMemFactoryは、メモリライフサイクルをアトミックなプラグアンドプレイコンポーネントに抽象化する。
我々はMemFactoryをオープンソースMemAgentアーキテクチャ上で公開トレーニングと評価データを用いて実証的に検証する。
論文 参考訳(メタデータ) (2026-03-31T09:38:21Z) - AMemGym: Interactive Memory Benchmarking for Assistants in Long-Horizon Conversations [61.6579785305668]
AMemGymは、メモリ駆動型パーソナライゼーションのためのオンライン評価と最適化を可能にする対話型環境である。
我々のフレームワークは、対話エージェントのメモリ能力を向上するためのスケーラブルで診断に富んだ環境を提供する。
論文 参考訳(メタデータ) (2026-03-02T15:15:11Z) - UMEM: Unified Memory Extraction and Management Framework for Generalizable Memory [46.87954895079213]
自己進化型メモリは、大規模言語モデル(LLM)のトレーニング可能なパラメータとして機能する
既存の方法は、メモリ抽出を静的プロセスとして扱いながら、メモリ管理を優先的に最適化する。
本稿では,大言語モデルを協調的に最適化し,メモリの抽出と管理を同時に行うための統一メモリ抽出管理(UMEM)を提案する。
論文 参考訳(メタデータ) (2026-02-11T08:58:41Z) - MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z) - Leveraging Metamemory Mechanisms for Enhanced Data-Free Code Generation in LLMs [44.80420740455364]
M2WFは、大規模言語モデルのワンタイムコード生成を改善するためのフレームワークである。
従来の方法とは異なり、キュレートされたデータへの依存を最小限に抑え、さまざまなコーディングシナリオに適応する。
コードとフレームワークはGitHubとHuggingFaceで公開されている。
論文 参考訳(メタデータ) (2025-01-14T07:16:43Z) - Online Adaptation of Language Models with a Memory of Amortized Contexts [82.02369596879817]
MAC(Memory of Amortized Contexts)は、大規模言語モデルのための効率的かつ効果的なオンライン適応フレームワークである。
MACとMACを組み合わせれば,検索の高速化など,一般的な代替手段の性能が向上することを示す。
論文 参考訳(メタデータ) (2024-03-07T08:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。