Fugu-MT 論文翻訳(概要): Learning to Commit: Generating Organic Pull Requests via Online Repository Memory

論文の概要: Learning to Commit: Generating Organic Pull Requests via Online Repository Memory

arxiv url: http://arxiv.org/abs/2603.26664v1
Date: Fri, 27 Mar 2026 17:58:56 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.636947
Title: Learning to Commit: Generating Organic Pull Requests via Online Repository Memory
Title（参考訳）: コミットの学習:オンラインリポジトリメモリによる有機プルリクエストの生成
Authors: Mo Li, L. H. Xu, Qitai Tan, Ting Cao, Yunxin Liu,
Abstract要約: 大きな言語モデル(LLM)ベースのコーディングエージェントは、制御されたベンチマークで印象的な結果を得るが、実際のメンテナが拒否するプルリクエストを定期的に生成する。オンラインリポジトリメモリを通じてこのギャップを埋めるフレームワークであるLearning to Commitを紹介します。
参考スコア（独自算出の注目度）: 11.042326503752756
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language model (LLM)-based coding agents achieve impressive results on controlled benchmarks yet routinely produce pull requests that real maintainers reject. The root cause is not functional incorrectness but a lack of organicity: generated code ignores project-specific conventions, duplicates functionality already provided by internal APIs, and violates implicit architectural constraints accumulated over years of development. Simply exposing an agent to the latest repository snapshot is not enough: the snapshot reveals the final state of the codebase, but not the repository-specific change patterns by which that state was reached. We introduce Learning to Commit, a framework that closes this gap through Online Repository Memory. Given a repository with a strict chronological split, the agent performs supervised contrastive reflection on earlier commits: it blindly attempts to resolve each historical issue, compares its prediction against the oracle diff, and distils the gap into a continuously growing set of skills-reusable patterns capturing coding style, internal API usage, and architectural invariants. When a new PR description arrives, the agent conditions its generation on these accumulated skills, producing changes grounded in the project's own evolution rather than generic pretraining priors. Evaluation is conducted on genuinely future, merged pull requests that could not have been seen during the skill-building phase, and spans multiple dimensions including functional correctness, code-style consistency, internal API reuse rate, and modified-region plausibility. Experiments on an expert-maintained repository with rich commit history show that Online Repository Memory effectively improves organicity scores on held-out future tasks.
Abstract（参考訳）: 大きな言語モデル(LLM)ベースのコーディングエージェントは、制御されたベンチマークで印象的な結果を得るが、実際のメンテナが拒否するプルリクエストを定期的に生成する。生成されたコードはプロジェクト固有の規約を無視し、内部APIによって提供された機能を重複させ、何年もの開発で蓄積された暗黙のアーキテクチャ制約に違反します。最新のリポジトリスナップショットにエージェントを公開するだけでは十分ではない。スナップショットはコードベースの最終状態を明らかにするが、その状態に到達したリポジトリ固有の変更パターンは公開しない。オンラインリポジトリメモリを通じてこのギャップを埋めるフレームワークであるLearning to Commitを紹介します。エージェントは、厳密な時間分割を持つレポジトリを前提として、前回のコミットを監督するコントラストリフレクションを実行する。各過去の問題を解決するために盲目的に試み、オラクル差に対する予測を比較し、そのギャップをコーディングスタイル、内部API使用、アーキテクチャ不変性をキャプチャする、継続的な成長可能なパターンのセットに排除する。新しいPR記述が到着すると、エージェントはこれらの蓄積したスキルに基づいて生成を条件付け、一般的な事前学習よりもプロジェクトの進化に根ざした変化を生み出す。真の未来において評価が行われ、スキル構築段階では見られなかったプルリクエストをマージし、機能的正確性、コードスタイルの一貫性、内部API再利用率、修正領域の可視性など、複数の次元にまたがる。豊富なコミット履歴を持つ専門家保守型リポジトリの実験は、オンラインリポジトリメモリが、保持された将来のタスクにおけるオーガニティスコアを効果的に改善することを示している。

関連論文リスト

GREPO: A Benchmark for Graph Neural Networks on Repository-Level Bug Localization [50.009407518866965]
リポジトリレベルのバグローカライゼーションは、ソフトウェアエンジニアリングの重要な課題です。 GNNは、複雑なリポジトリ全体の依存関係をモデル化できるため、有望な代替手段を提供する。 GREPOは、リポジトリスケールのバグローカライゼーションタスクのための最初のGNNベンチマークである。
論文参考訳（メタデータ） (2026-02-14T23:22:15Z)
Do Not Treat Code as Natural Language: Implications for Repository-Level Code Generation and Beyond [13.550121154853715]
自然言語ではなく構造化コードとしてコードを扱う,リポジトリレベルのコード生成フレームワークであるHydraを紹介します。我々はHydraがオープンソースおよびクローズドソースのCodeLLMにまたがって最先端のパフォーマンスを実現することを示す。
論文参考訳（メタデータ） (2026-02-12T07:44:00Z)
ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development [72.4729759618632]
本稿では,現実的かつ実行可能なワークフロー内でエージェントバックエンドコーディングを評価するベンチマークであるABC-Benchを紹介する。オープンソースリポジトリから8つの言語と19のフレームワークにまたがる224の実践的なタスクをキュレートしました。我々の評価は、最先端モデルでさえ、これらの総合的なタスクに対して信頼性の高いパフォーマンスを提供するのに苦労していることを示している。
論文参考訳（メタデータ） (2026-01-16T08:23:52Z)
In Line with Context: Repository-Level Code Generation via Context Inlining [11.065371614078723]
本稿では,リポジトリレベルのコード生成のための新しいフレームワークであるInlineCoderを紹介する。 InlineCoderは、未完成の関数をコールグラフにインライン化することで、リポジトリコンテキストの理解を強化する。
論文参考訳（メタデータ） (2026-01-01T15:56:24Z)
NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents [79.29376673236142]
既存のベンチマークは、完全なソフトウェアシステムを構築するのに必要な長期的能力の厳格な評価に失敗する。符号化エージェントの長期リポジトリ生成能力を評価するために設計されたベンチマークであるNL2Repo Benchを提案する。
論文参考訳（メタデータ） (2025-12-14T15:12:13Z)
Improving Code Localization with Repository Memory [33.423769985220005]
本稿では,最近の過去のコミットや関連問題を含む非パラメトリックメモリからエージェントを検索するツールを紹介する。このようなメモリの拡張により,最先端のローカライゼーションフレームワークであるLocAgentが大幅に向上することを示す。
論文参考訳（メタデータ） (2025-10-01T15:10:15Z)
LLM-Driven Collaborative Model for Untangling Commits via Explicit and Implicit Dependency Reasoning [15.20947984949809]
コミット回避のための新しいコラボレーティブコンサルテーションフレームワークであるColaUntangleを提案する。 ColaUntangleは、LLM(Large Language Model)駆動エージェントをマルチエージェントアーキテクチャに統合する。広く使われている2つのデータセット(1,612 C#と14k Java tangledコミット)上でColaUntangleを評価する。
論文参考訳（メタデータ） (2025-07-22T09:42:13Z)
COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement [80.18490952057125]
反復改良は、複雑なタスクにおける大規模言語モデル(LLM)の能力を高める効果的なパラダイムとして登場した。我々はこれらの課題を克服するために、コンテキストワイズ順序非依存言語モデリング(COrAL)を提案する。当社のアプローチでは、管理可能なコンテキストウィンドウ内で複数のトークン依存関係をモデル化しています。
論文参考訳（メタデータ） (2024-10-12T23:56:19Z)
Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。 Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文参考訳（メタデータ） (2024-06-03T15:20:06Z)
RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2023-03-22T13:54:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。