論文の概要: Improving Code Localization with Repository Memory
- arxiv url: http://arxiv.org/abs/2510.01003v1
- Date: Wed, 01 Oct 2025 15:10:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.63309
- Title: Improving Code Localization with Repository Memory
- Title(参考訳): リポジトリメモリによるコードローカライゼーションの改善
- Authors: Boshi Wang, Weijian Xu, Yunsheng Li, Mei Gao, Yujia Xie, Huan Sun, Dongdong Chen,
- Abstract要約: 本稿では,最近の過去のコミットや関連問題を含む非パラメトリックメモリからエージェントを検索するツールを紹介する。
このようなメモリの拡張により,最先端のローカライゼーションフレームワークであるLocAgentが大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 33.423769985220005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code localization is a fundamental challenge in repository-level software engineering tasks such as bug fixing. While existing methods equip language agents with comprehensive tools/interfaces to fetch information from the repository, they overlook the critical aspect of memory, where each instance is typically handled from scratch assuming no prior repository knowledge. In contrast, human developers naturally build long-term repository memory, such as the functionality of key modules and associations between various bug types and their likely fix locations. In this work, we augment language agents with such memory by leveraging a repository's commit history - a rich yet underutilized resource that chronicles the codebase's evolution. We introduce tools that allow the agent to retrieve from a non-parametric memory encompassing recent historical commits and linked issues, as well as functionality summaries of actively evolving parts of the codebase identified via commit patterns. We demonstrate that augmenting such a memory can significantly improve LocAgent, a state-of-the-art localization framework, on both SWE-bench-verified and the more recent SWE-bench-live benchmarks. Our research contributes towards developing agents that can accumulate and leverage past experience for long-horizon tasks, more closely emulating the expertise of human developers.
- Abstract(参考訳): コードのローカライゼーションは、バグ修正などのリポジトリレベルのソフトウェアエンジニアリングタスクにおいて、根本的な課題である。
既存のメソッドは、レポジトリから情報を取得するための包括的なツールやインターフェースを言語エージェントに装備するが、それらは、以前のリポジトリの知識がなければ、各インスタンスがスクラッチから処理される、というメモリの重要な側面を見落としている。
対照的に、人間開発者は、キーモジュールの機能や、様々なバグタイプと修正箇所の関連性など、長期のリポジトリメモリを自然に構築する。
この作業では、リポジトリのコミット履歴(コードベースの進化を詳述するリッチで未使用のリソース)を活用することで、そのようなメモリで言語エージェントを強化します。
我々は、エージェントが最近の過去のコミットや関連する問題を含む非パラメトリックメモリから取り出すことができるツールと、コミットパターンを介して特定されたコードベースの活発に進化する部分の機能を要約するツールを導入する。
我々は,SWE-bench-verified と SWE-bench-live ベンチマークの両方において,最先端のローカライゼーションフレームワークである LocAgent を改良できることを実証した。
我々の研究は、長年の業務に過去の経験を蓄積し活用し、人間の開発者の専門知識をより密にエミュレートできるエージェントの開発に貢献する。
関連論文リスト
- SweRank: Software Issue Localization with Code Ranking [109.3289316191729]
SweRankは、ソフトウェア問題ローカライゼーションのための効率的な検索と参照のためのフレームワークである。
パブリックなGitHubリポジトリからキュレートされた大規模なデータセットであるSweLocを構築します。
SweRankは最先端の性能を達成し、従来のランキングモデルとコストの高いエージェントベースシステムの両方より優れていることを示す。
論文 参考訳(メタデータ) (2025-05-07T19:44:09Z) - On the Impacts of Contexts on Repository-Level Code Generation [5.641402231731082]
本稿ではレポジトリレベルのコード生成を評価するために設計された新しいベンチマークであるRepoExecを紹介する。
実行可能性、包括的なテストケース生成による機能的正当性、ファイル間のコンテキストの正確な利用という3つの重要な側面に注目します。
論文 参考訳(メタデータ) (2024-06-17T10:45:22Z) - On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文 参考訳(メタデータ) (2024-06-06T19:44:17Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - A Survey on the Memory Mechanism of Large Language Model based Agents [66.4963345269611]
大規模言語モデル(LLM)に基づくエージェントは、最近、研究や産業コミュニティから多くの注目を集めている。
LLMベースのエージェントは、現実の問題を解決する基礎となる自己進化能力に特徴付けられる。
エージェント-環境相互作用をサポートする重要なコンポーネントは、エージェントのメモリである。
論文 参考訳(メタデータ) (2024-04-21T01:49:46Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z) - Topical: Learning Repository Embeddings from Source Code using Attention [3.110769442802435]
本稿では,リポジトリレベルの埋め込みのための新しいディープニューラルネットワークであるTopicalを提案する。
attentionメカニズムはソースコード、フル依存グラフ、スクリプトレベルのテキストデータからリポジトリレベルの表現を生成する。
論文 参考訳(メタデータ) (2022-08-19T18:13:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。