論文の概要: Your Code Agent Can Grow Alongside You with Structured Memory
- arxiv url: http://arxiv.org/abs/2603.13258v1
- Date: Wed, 25 Feb 2026 06:39:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.239146
- Title: Your Code Agent Can Grow Alongside You with Structured Memory
- Title(参考訳): コードエージェントは構造化メモリであなたと一緒に成長できる
- Authors: Yi-Xuan Deng, Xiaoqin Liu, Yi Zhang, Guo-Wei Yang, Shuojin Yang,
- Abstract要約: 我々は,人間とAIの継続的な共進化を可能にするフレームワークであるMemCoderを提案する。
MemCoderはまず、過去のコミットから潜伏した意図-コードマッピングを蒸留するために、過去の人間の経験を構造化する。
次に、検証フィードバックによって駆動される自己リファインメントメカニズムを使用して、エージェントの動作をリアルタイムで修正する。
- 参考スコア(独自算出の注目度): 6.836735626065529
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While "Intent-oriented programming" (or "Vibe Coding") redefines software engineering, existing code agents remain tethered to static code snapshots. Consequently, they struggle to model the critical information embedded in the temporal evolution of projects, failing to leverage the "reasoning trajectories" implicit in past successful practices. This limitation results in rigid behavioral logic and a lack of autonomous adaptability, ultimately hindering their ability to tackle complex, repository-level problems. To bridge this static-dynamic mismatch, we propose MemCoder, a framework designed to enable continual human-AI co-evolution. MemCoder first structures historical human experience to distill latent intent-to-code mappings from past commits. It then employs a self-refinement mechanism driven by verification feedback to correct agent behavior in real-time. Crucially, an experience self-internalization mechanism is introduced to crystallize human-validated solutions into long-term knowledge, thereby supporting sustained evolution. Experimental results on SWE-bench Verified demonstrate that MemCoder not only achieves State-of-the-Art (SOTA) performance but also delivers a 9.4% improvement in resolved rate over the general foundation model DeepSeek-V3.2. These findings indicate that equipping agents with the capability to co-evolve with humans via project history and real-time feedback effectively unlocks the potential of general models in complex software engineering tasks.
- Abstract(参考訳): Intent-oriented programming"(あるいは"Vibe Coding")はソフトウェアエンジニアリングを再定義するが、既存のコードエージェントは静的コードスナップショットに結びついている。
その結果、彼らはプロジェクトの時間的進化に埋め込まれたクリティカルな情報をモデル化するのに苦労し、過去の成功例で暗黙的に"合理的な軌跡"を活用することができませんでした。
この制限は、厳格な振る舞い論理と自律的な適応性の欠如をもたらし、最終的には複雑なリポジトリレベルの問題に対処する能力を妨げる。
この静的なミスマッチをブリッジするために,人間とAIの連続的共進化を可能にするフレームワークであるMemCoderを提案する。
MemCoderはまず、過去のコミットから潜伏した意図-コードマッピングを蒸留するために、過去の人間の経験を構造化する。
次に、検証フィードバックによって駆動される自己リファインメントメカニズムを使用して、エージェントの動作をリアルタイムで修正する。
重要なことに、長期的な知識に人為的なソリューションを結晶化し、持続的な進化をサポートするために、経験的な自己内部化メカニズムが導入されている。
SWE-bench Verifiedの実験結果によると、MemCoderはステート・オブ・ザ・アーツ(SOTA)のパフォーマンスを達成するだけでなく、一般的な基盤モデルであるDeepSeek-V3.2よりも9.4%改善されている。
これらの結果は、プロジェクト履歴とリアルタイムフィードバックを通じて人間との共同開発能力を持つエージェントを装備することで、複雑なソフトウェアエンジニアリングタスクにおける汎用モデルの可能性を効果的に解き放つことを示唆している。
関連論文リスト
- EvoClaw: Evaluating AI Agents on Continuous Software Evolution [47.49468375065129]
ノイズの多いコミットログから検証可能なマイルストーンDAGを再構築するエージェントパイプラインであるDeepCommitを紹介する。
これらの実行可能なシーケンスは、エージェントがシステムの完全性を維持し、エラーの蓄積を制限する必要がある新しいベンチマークであるEvoClawを可能にする。
論文 参考訳(メタデータ) (2026-03-13T03:20:40Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently [35.39097522391409]
大規模言語モデル(LLM)は短期的なタスクで優れており、それらを長期のエージェント合成に拡張することは依然として困難である。
本稿では,PRチェーンから構造化監視を体系的にマイニングするdaVinci-Agencyを提案する。
DaVinci-AgencyのPR基底構造は、本質的には、永続的なゴールサイクルの振る舞いを教えるのに不可欠な因果依存性と反復的な洗練を保っている。
論文 参考訳(メタデータ) (2026-02-02T13:23:39Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - SWE-Bench-CL: Continual Learning for Coding Agents [0.0]
SWE-Bench-CLは、人間検証されたSWE-Bench検証データセット上に構築された、新しい連続学習ベンチマークである。
GitHubのイシューを、自然リポジトリの進化を反映した時系列順序に整理することで、SWE-Bench-CLは、エージェントのエクスペリエンスを蓄積する能力を直接評価できる。
論文 参考訳(メタデータ) (2025-06-13T07:11:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。