論文の概要: Repository Intelligence Graph: Deterministic Architectural Map for LLM Code Assistants
- arxiv url: http://arxiv.org/abs/2601.10112v1
- Date: Thu, 15 Jan 2026 06:42:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.020356
- Title: Repository Intelligence Graph: Deterministic Architectural Map for LLM Code Assistants
- Title(参考訳): リポジトリインテリジェンスグラフ:LLMコードアシスタントのための決定論的アーキテクチャマップ
- Authors: Tsvi Cherny-Shahar, Amiram Yehudai,
- Abstract要約: リポジトリを意識したコーディングエージェントは、しばしばビルドとテストの構造を回復するのに苦労する。
私たちは、ビルド可能なコンポーネント、アグリゲータ、ランナー、テスト、外部パッケージ、パッケージマネージャを表す決定論的、エビデンスを背景としたアーキテクチャマップであるRepository Intelligence Graph(RIG)を紹介します。
Claude Code、Cursor、Codexの3つの商用エージェントを、現実世界のMetaFFIプロジェクトを含む、低から高ビルドの複雑さにまたがる8つのリポジトリで評価します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Repository aware coding agents often struggle to recover build and test structure, especially in multilingual projects where cross language dependencies are encoded across heterogeneous build systems and tooling. We introduce the Repository Intelligence Graph (RIG), a deterministic, evidence backed architectural map that represents buildable components, aggregators, runners, tests, external packages, and package managers, connected by explicit dependency and coverage edges that trace back to concrete build and test definitions. We also present SPADE, a deterministic extractor that constructs RIG from build and test artifacts (currently with an automatic CMake plugin based on the CMake File API and CTest metadata), and exposes RIG as an LLM friendly JSON view that agents can treat as the authoritative description of repository structure. We evaluate three commercial agents (Claude Code, Cursor, Codex) on eight repositories spanning low to high build oriented complexity, including the real world MetaFFI project. Each agent answers thirty structured questions per repository with and without RIG in context, and we measure accuracy, wall clock completion time, and efficiency (seconds per correct answer). Across repositories and agents, providing RIG improves mean accuracy by 12.2\% and reduces completion time by 53.9\%, yielding a mean 57.8\% reduction in seconds per correct answer. Gains are larger in multilingual repositories, which improve by 17.7\% in accuracy and 69.5\% in efficiency on average, compared to 6.6\% and 46.1\% in single language repositories. Qualitative analysis suggests that RIG shifts failures from structural misunderstandings toward reasoning mistakes over a correct structure, while rare regressions highlight that graph based reasoning quality remains a key factor.
- Abstract(参考訳): リポジトリを意識したコーディングエージェントは、ビルドとテストの構造を回復するのに苦労することが多い。
Repository Intelligence Graph(RIG)は、ビルド可能なコンポーネント、アグリゲータ、ランナー、テスト、外部パッケージ、パッケージマネージャを表す決定論的でエビデンスに裏付けられたアーキテクチャマップで、明示的な依存関係とカバレッジエッジによって接続され、具体的なビルドとテスト定義に遡る。
また,ビルドおよびテストアーティファクト(CMake File APIとCTestメタデータをベースとした自動CMakeプラグイン)からRIGを構成する決定論的抽出器であるSPADEを,エージェントがリポジトリ構造の権威的な記述として扱えるLLMフレンドリなJSONビューとして公開する。
Claude Code、Cursor、Codexの3つの商用エージェントを、現実世界のMetaFFIプロジェクトを含む、低から高ビルド指向の複雑さにまたがる8つのリポジトリで評価します。
各エージェントは,レポジトリ当たり30の構造化された質問に,RIGを使用・使用せずに回答し,精度,壁時計完了時間,効率(正解秒)を測定した。
リポジトリやエージェント全体で、RIGを提供すると平均精度が12.2\%向上し、完了時間が53.9\%低下し、正解1秒あたり平均57.8\%低下する。
多言語リポジトリではゲインが大きくなり、単一の言語リポジトリでは6.6\%と46.1\%に対して、精度が17.7\%、効率が69.5\%向上した。
定性的な分析は、RIGが失敗を構造的誤解から正しい構造上の推論ミスへシフトさせるのに対して、グラフベースの推論品質が重要な要素であることを示している。
関連論文リスト
- NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents [79.29376673236142]
既存のベンチマークは、完全なソフトウェアシステムを構築するのに必要な長期的能力の厳格な評価に失敗する。
符号化エージェントの長期リポジトリ生成能力を評価するために設計されたベンチマークであるNL2Repo Benchを提案する。
論文 参考訳(メタデータ) (2025-12-14T15:12:13Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Git Context Controller: Manage the Context of LLM-based Agents like Git [6.521644491529639]
大きな言語モデル(LLM)ベースのエージェントは、内部推論と外部ツールの使用をインターリーブすることによって、印象的な機能を示している。
ソフトウェアバージョン管理システムにインスパイアされた構造化コンテキスト管理フレームワークであるGit-Context-Controller(GCC)を紹介した。
自己複製のケーススタディでは、GCCを増強したエージェントが新しいCLIエージェントをスクラッチから作り、40.7タスクの解決を実現した。
論文 参考訳(メタデータ) (2025-07-30T08:01:45Z) - Enhancing repository-level software repair via repository-aware knowledge graphs [13.747293341707563]
リポジトリレベルのソフトウェア修復は、問題記述とコードパッチの間のセマンティックギャップを埋める際の課題に直面します。
既存のアプローチは、大きな言語モデル(LLM)に依存しており、意味的曖昧さ、構造的文脈の限られた理解、推論能力の不足によって妨げられている。
本稿では,リポジトリアーティファクト(課題とプル要求)とエンティティ(ファイル,クラス,関数)を正確にリンクする新しいリポジトリ対応知識グラフ(KG)を提案する。
KGをマイニングした経路を利用する経路誘導補修機構により,説明とともに文脈情報を拡張することができる。
論文 参考訳(メタデータ) (2025-03-27T17:21:47Z) - DependEval: Benchmarking LLMs for Repository Dependency Understanding [16.19185341217556]
大規模言語モデル(LLM)は、コード生成、現実のソフトウェア開発において、リポジトリレベルの推論の高度な要求において、かなり有望であることを示している。
リポジトリ依存性の理解(DependEval)を評価するために設計された階層的なベンチマークを導入する。
Benchmarkは、現実世界のWebサイトから収集された15,576のリポジトリに基づいている。
論文 参考訳(メタデータ) (2025-03-09T16:45:22Z) - RustRepoTrans: Repository-level Code Translation Benchmark Targeting Rust [50.65321080814249]
RustRepoTransは、インクリメンタル翻訳をターゲットにした、最初のリポジトリレベルのコンテキストコード変換ベンチマークである。
複雑な翻訳シナリオの制約を評価するために, 7つの代表的なLLMを評価し, それらの誤差を分析した。
論文 参考訳(メタデータ) (2024-11-21T10:00:52Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository [4.767858874370881]
実世界のリポジトリ内でクラスレベルのコードを生成する際に,LLMを厳格に評価するためのベンチマークであるRepoClassBenchを紹介する。
RepoClassBenchには、リポジトリの選択からJava、Python、C#にまたがる"Natural Language to Class Generation"タスクが含まれている。
Retrieve-Repotools-Reflect (RRR)は,レポジトリレベルのコンテキストを反復的にナビゲートし,推論する静的解析ツールを備えた新しいアプローチである。
論文 参考訳(メタデータ) (2024-04-22T03:52:54Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。