論文の概要: Closing the Loop: Universal Repository Representation with RPG-Encoder
- arxiv url: http://arxiv.org/abs/2602.02084v2
- Date: Tue, 03 Feb 2026 18:33:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.868478
- Title: Closing the Loop: Universal Repository Representation with RPG-Encoder
- Title(参考訳): ループのクローズ:RPGエンコーダによるユニバーサルリポジトリ表現
- Authors: Jane Luo, Chengyu Yin, Xin Zhang, Qingtao Li, Steven Liu, Yiming Huang, Jie Wu, Hao Liu, Yangyu Huang, Yu Kang, Fangkai Yang, Ying Xin, Scarlett Li,
- Abstract要約: 本稿では,リポジトリ計画グラフ(RPG)を統一表現に一般化するフレームワークであるRPG-Encoderを提案する。
RPG-Encoderは3つのメカニズムを通じて推論ループを閉じる。
93.7%のAcc@5で検証されたSWE-bench上での最先端のローカライゼーション性能を確立し、SWE-bench Live Lite上でのローカライゼーション精度を10%以上越えている。
- 参考スコア(独自算出の注目度): 26.428468203770663
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current repository agents encounter a reasoning disconnect due to fragmented representations, as existing methods rely on isolated API documentation or dependency graphs that lack semantic depth. We consider repository comprehension and generation to be inverse processes within a unified cycle: generation expands intent into implementation, while comprehension compresses implementation back into intent. To address this, we propose RPG-Encoder, a framework that generalizes the Repository Planning Graph (RPG) from a static generative blueprint into a unified, high-fidelity representation. RPG-Encoder closes the reasoning loop through three mechanisms: (1) Encoding raw code into the RPG that combines lifted semantic features with code dependencies; (2) Evolving the topology incrementally to decouple maintenance costs from repository scale, reducing overhead by 95.7%; and (3) Operating as a unified interface for structure-aware navigation. In evaluations, RPG-Encoder establishes state-of-the-art localization performance on SWE-bench Verified with 93.7% Acc@5 and exceeds the best baseline by over 10% in localization accuracy on SWE-bench Live Lite. These results highlight our superior fine-grained precision in complex codebases. Furthermore, it achieves 98.5% reconstruction coverage on RepoCraft, confirming RPG's high-fidelity capacity to mirror the original codebase and closing the loop between intent and implementation.
- Abstract(参考訳): 既存のメソッドは、セマンティックディープを欠いた独立したAPIドキュメントや依存性グラフに依存しているため、現在のリポジトリエージェントは、断片化された表現による推論の切断に直面している。
我々は、リポジトリの理解と生成を統一サイクル内の逆プロセスと考える:生成はインテントを実装へと拡張し、コンクルージョンは実装をインテントに圧縮する。
これを解決するために,静的な生成図から高忠実度表現へのリポジトリ計画グラフ(RPG)を一般化するフレームワークであるRPG-Encoderを提案する。
RPG-Encoderは3つのメカニズムを通じて推論ループを閉じている。(1) 引き上げられたセマンティック機能とコード依存関係を組み合わせたRPGに生コードをエンコードする(2) リポジトリスケールからメンテナンスコストを分離するためにトポロジを段階的に進化させ、オーバーヘッドを95.7%削減する(3) 構造認識ナビゲーションの統一インターフェースとして運用する。
評価では、RPG-Encoderは93.7%のAcc@5で検証されたSWE-bench上での最先端のローカライゼーション性能を確立し、SWE-bench Live Lite上でのローカライゼーション精度を10%以上越えている。
これらの結果は、複雑なコードベースにおけるより優れたきめ細かい精度を浮き彫りにする。
さらに、RepoCraftの98.5%の再構築が達成され、RPGの本来のコードベースを反映し、インテントと実装の間のループを閉じるための高忠実度キャパシティを確認する。
関連論文リスト
- SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - In Line with Context: Repository-Level Code Generation via Context Inlining [11.065371614078723]
本稿では,リポジトリレベルのコード生成のための新しいフレームワークであるInlineCoderを紹介する。
InlineCoderは、未完成の関数をコールグラフにインライン化することで、リポジトリコンテキストの理解を強化する。
論文 参考訳(メタデータ) (2026-01-01T15:56:24Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - ZeroGR: A Generalizable and Scalable Framework for Zero-Shot Generative Retrieval [125.19156877994612]
生成検索(GR)は、情報検索(IR)を文書識別子(ドシデント)の生成としてフレーミングすることによって再構成する
我々は、自然言語命令を利用して幅広いIRタスクにわたってGRを拡張するゼロショット生成検索フレームワークであるtextscZeroGRを提案する。
具体的には、textscZeroGRは、3つのキーコンポーネントで構成されている: (i)不均一な文書を意味的に意味のあるドシデントに統一するLMベースのドシデントジェネレータ; (ii)自然言語タスク記述から様々なタイプのクエリを生成し、拡張する命令チューニングクエリジェネレータ。
論文 参考訳(メタデータ) (2025-10-12T03:04:24Z) - RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.834864953082302]
Repository Planning Graph (RPG)は、統一グラフ内の機能、ファイル構造、データフロー、関数をエンコードする。
ZeroRepoは、提案レベルの計画、実装レベルの構築、テストバリデーションを備えたグラフ誘導コード生成という、グラフ駆動のフレームワークである。
論文 参考訳(メタデータ) (2025-09-19T17:58:14Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。