論文の概要: AOCI: Symbolic-Semantic Indexing for Practical Repository-Scale Code Understanding with LLMs
- arxiv url: http://arxiv.org/abs/2605.02421v1
- Date: Mon, 04 May 2026 10:13:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.234938
- Title: AOCI: Symbolic-Semantic Indexing for Practical Repository-Scale Code Understanding with LLMs
- Title(参考訳): AOCI: LLMを用いた実用的なリポジトリスケールコード理解のためのシンボリックセマンティックインデックス作成
- Authors: Jinshi Liu, Hanying Zuo, Congyin Cao, Anran Zhang, Yixuan Liu, Xinzhou Xie,
- Abstract要約: 本稿では, シンボリック・セマンティックなリポジトリ表現であるAOCIを紹介する。
AOCIインデックスは、コード単位ごとに1つのエントリを持つエントリが続くエンコーディングルールで構成されている。
AOCIはOracle上層部に次ぐ総合的精度で第2位である。
- 参考スコア(独自算出の注目度): 6.837894695838593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models struggle with understanding codebases beyond a certain scale -- repositories with hundreds of thousands of lines of code. Existing methods -- retrieval, summarization, agent exploration -- each construct a different view at query time. The view varies between runs, and what persists is typically ad-hoc rather than systematic. This paper introduces AOCI (AI-Oriented Code Indexing): a symbolic-semantic repository representation -- a structured blueprint that an LLM can read in a single pass to gain a complete repository-level picture of the system's architecture, dependencies, and key design decisions before any task. An AOCI index consists of encoding rules followed by entries, with one entry per code unit (file or database table). Each entry pairs a symbolic tag with semantic content. The symbolic component provides architectural coordinates; the semantic component carries function, dependencies, and constraints. Together they form a consistent, stable representation of the entire system. Index maintenance is incremental: when code changes, only affected entries are regenerated under protocol rules. The AOCI Platform automates this process, keeping the blueprint aligned with the code. We evaluated AOCI on four projects across three LLMs and six context conditions (2,160 evaluations). AOCI outperforms all deployable baselines and ranks second only to the Oracle upper bound in overall accuracy. On 19 industrial tasks across five systems, AOCI produced zero final-state defects, while three mainstream agent-based tools introduced defects in 12 tasks and consumed 4--130$\times$ more tokens ($p < 0.001$). The advantage grows with task complexity.
- Abstract(参考訳): 大規模な言語モデルは、コードベースの理解に苦慮している - 数十万行のコードを持つリポジトリ。既存のメソッド -- 検索、要約、エージェント探索 -- は、クエリ時に異なるビューを構築する。
ビューは実行時間によって異なり、永続化されるものは通常、体系的ではなくアドホックである。
本稿では、AOCI(AI-Oriented Code Indexing:AI-Oriented Code Indexing)を紹介します。 シンボリック・セマンティックなリポジトリ表現 -- LLMが単一パスで読み取ることができる構造化青写真で、システムのアーキテクチャ、依存関係、タスク前の重要な設計決定の完全なリポジトリレベル図を取得する。
AOCIインデックスは、コード単位ごとに1つのエントリ(ファイルまたはデータベーステーブル)を持つエントリが続くエンコーディングルールで構成されている。
各エントリは、セマンティックコンテンツとシンボリックタグをペアリングする。
シンボリックコンポーネントはアーキテクチャの座標を提供し、セマンティックコンポーネントは関数、依存関係、制約を運ぶ。
それらは共に、システム全体の一貫した安定した表現を形成する。
インデックスのメンテナンスは漸進的 – コードが変更されると、影響を受けるエントリだけがプロトコルルールの下で再生されます。
AOCI Platformはこのプロセスを自動化し、ブループリントをコードに一致させます。
3つのLSMと6つの状況条件(2,160件)にわたる4つのプロジェクトについてAOCIを評価した。
AOCIはデプロイ可能なベースラインをすべて上回り、全体の正確さでOracle上限に次いで2位にランクインする。
5つのシステムにわたる19の産業タスクにおいて、AOCIは最終状態の欠陥をゼロとし、3つの主要なエージェントベースのツールは12のタスクに欠陥を導入し、4-130$\times$より多くのトークン(p < 0.001$)を消費した。
アドバンテージはタスクの複雑さによって増大します。
関連論文リスト
- IMPACT: A Dataset for Multi-Granularity Human Procedural Action Understanding in Industrial Assembly [79.737814043505]
IMPACTは、デプロイメント指向の産業手続き的理解のための5ビューのRGB-Dデータセットである。
実際の組み立てと、プロ向けのツールを備えた商業用アングルグラインダーの分解を中心に構築されている。
論文 参考訳(メタデータ) (2026-04-12T02:09:19Z) - Label-Free Cross-Task LoRA Merging with Null-Space Compression [50.63908869296697]
我々は,ラベルフリーで出力に依存しない手法であるNull-Space Compression (NSC) Mergingを紹介した。
NSCは、従来のメソッドがタスクのサブセットに収まるバランスの取れたゲインを持つ20の異種視覚タスクに対して、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-27T11:34:41Z) - Theory of Code Space: Do Code Agents Understand Software Architecture? [0.0]
コードエージェントは、分離されたタスクで優れているが、アーキテクチャの理解を必要とするマルチファイルソフトウェアエンジニアリングと苦労する。
エージェントがAI探索中に一貫性のあるアーキテクチャの信念を構築し、維持し、更新できるかどうかを評価するベンチマークである、コード空間の理論(ToCS)を紹介する。
論文 参考訳(メタデータ) (2026-02-28T11:40:17Z) - Gistify! Codebase-Level Understanding via Runtime Execution [97.63528391679807]
Gistifyは、コーディング LLM が特定の機能を再現できる単一で最小限の自己完結型ファイルを作成する必要があるタスクである。
現在の最先端モデルは、Gistifyタスク、特に長時間実行のあるタスクを確実に解くのに苦労している。
論文 参考訳(メタデータ) (2025-10-30T17:58:26Z) - RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval [0.38298911754746934]
汎用自動化ソフトウェアエンジニアリング(ASE)には、コード補完、検索、修復、QA、要約といったタスクが含まれる。
これらのタスクは、コードエンティティやコードエンティティクエリに関する特定のクエリを処理できるコード検索システムを必要とする。
本稿では、両方のクエリタイプに対応するように設計されたリポジトリレベルのコード検索エージェントであるRANGERを紹介する。
論文 参考訳(メタデータ) (2025-09-27T18:57:02Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - CodeRAG: Supportive Code Retrieval on Bigraph for Real-World Code Generation [69.684886175768]
大規模言語モデル(LLM)は、自動コード生成において有望なパフォーマンスを示している。
本稿では,検索拡張コード生成フレームワークであるCodeRAGを提案する。
実験によると、CodeRAGはRAGのシナリオと比較して大幅に改善されている。
論文 参考訳(メタデータ) (2025-04-14T09:51:23Z) - CodexGraph: Bridging Large Language Models and Code Repositories via Code Graph Databases [13.733229886643041]
大きな言語モデル(LLM)は、HumanEvalやMBPPのようなスタンドアロンのコードタスクに優れていますが、コードリポジトリ全体の処理に苦労しています。
類似性に基づく検索は複雑なタスクではリコールが低いことが多いが、手動ツールやAPIは通常タスク固有であり、専門家の知識を必要とする。
我々は,LLMエージェントをコードリポジトリから抽出したグラフデータベースインターフェースと統合するシステムであるCodexGraphを紹介する。
論文 参考訳(メタデータ) (2024-08-07T17:13:59Z) - Long Code Arena: a Set of Benchmarks for Long-Context Code Models [75.70507534322336]
Long Code Arenaは、プロジェクト全体のコンテキストを必要とするコード処理タスクのための6つのベンチマークスイートである。
これらのタスクは、ライブラリベースのコード生成、CIビルドの修復、プロジェクトレベルのコード補完、コミットメッセージ生成、バグローカライゼーション、モジュールの要約といった、コード処理のさまざまな側面をカバーする。
各タスクに対して、テスト用の手作業によるデータセット、評価スイート、オープンソースのベースラインソリューションを提供しています。
論文 参考訳(メタデータ) (2024-06-17T14:58:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。