論文の概要: TypeScript Repository Indexing for Code Agent Retrieval
- arxiv url: http://arxiv.org/abs/2604.18413v2
- Date: Tue, 21 Apr 2026 16:00:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 14:04:47.94895
- Title: TypeScript Repository Indexing for Code Agent Retrieval
- Title(参考訳): コードエージェント検索のためのTypeScript Repository Indexing
- Authors: Junsong Pu, Yichen Li, Zhuangbin Chen,
- Abstract要約: グラフベースのコードインデックスは、LLMベースのコードエージェントのコンテキスト検索を改善することができる。
ABCoderは、UniASTと呼ばれる関数レベルのコードインデックスに関係を解析するオープンソースのフレームワークである。
abcoder-ts-parserは、コンパイラのAST、セマンティック情報、モジュールロジックに直接動作するTypeScript APIである。
- 参考スコア(独自算出の注目度): 5.2771618850569375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph-based code indexing can improve context retrieval for LLM-based code agents by preserving call chains and dependency relationships that keyword search and similarity retrieval often miss. ABCoder is an open-source framework that parses codebases into a function-level code index called UniAST. Its existing parsers combine lightweight AST parsers for syntactic analysis with language servers for semantic resolution, but because LSP-based resolution requires a JSON-RPC call for each symbol lookup, these per-symbol calls become a bottleneck on large TypeScript repositories. We present abcoder-ts-parser, a TypeScript parser built on the TypeScript Compiler API that works directly with the compiler's AST, semantic information, and module resolution logic. We evaluate the parser on three open-source TypeScript projects with up to 1.2 million lines of code and find that it produces reliable indexes significantly more efficiently than the existing architecture. For a live demonstration, watch: https://youtu.be/ryssr7ouvdE
- Abstract(参考訳): グラフベースのコードインデックスは、キーワード検索や類似性検索でしばしば見逃されるコールチェーンと依存関係の関係を保存することで、LLMベースのコードエージェントのコンテキスト検索を改善することができる。
ABCoderはUniASTと呼ばれる関数レベルのコードインデックスにコードベースを解析するオープンソースフレームワークである。
既存のパーサは、構文解析のための軽量ASTパーサとセマンティックレゾリューションのための言語サーバーを組み合わせたものだが、LSPベースの解決にはシンボルのルックアップ毎にJSON-RPCコールが必要であるため、これらのシンボルごとの呼び出しは、大きなTypeScriptリポジトリでボトルネックとなる。
TypeScript Compiler API上に構築されたTypeScriptパーサであるabcoder-ts-parserを紹介します。
最大120万行のコードを持つ3つのオープンソースのTypeScriptプロジェクトのパーサを評価し、既存のアーキテクチャよりも信頼性の高いインデックスを生成することを発見した。
ライブデモは、https://youtu.be/ryssr7ouvdE
関連論文リスト
- RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval [0.38298911754746934]
汎用自動化ソフトウェアエンジニアリング(ASE)には、コード補完、検索、修復、QA、要約といったタスクが含まれる。
これらのタスクは、コードエンティティやコードエンティティクエリに関する特定のクエリを処理できるコード検索システムを必要とする。
本稿では、両方のクエリタイプに対応するように設計されたリポジトリレベルのコード検索エージェントであるRANGERを紹介する。
論文 参考訳(メタデータ) (2025-09-27T18:57:02Z) - Parsing the Switch: LLM-Based UD Annotation for Complex Code-Switched and Low-Resource Languages [11.627508350795118]
BiLinguaは、コード変更されたテキストに対するUniversal Dependencies(UD)アノテーションのためのパイプラインである。
まず、スペイン語とスペイン語のGuaran'iデータのためのプロンプトベースのフレームワークを開発する。
第2に、最初のスペインのGuaran'i-parsed corpusを含む2つのデータセットをリリースします。
第3に、言語対と通信コンテキスト間のスイッチポイントの詳細な構文解析を行う。
論文 参考訳(メタデータ) (2025-06-08T20:23:57Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - Neuro-Symbolic Query Compiler [57.78201019000895]
本稿では,このギャップを埋めるために,言語文法規則とコンパイラ設計に触発されたニューラルシンボリックなフレームワークQCompilerを提案する。
理論上は、複雑なクエリを形式化するのに最小でも十分なバックス・ナウアー形式(BNF)の文法を$G[q]$で設計する。
葉のサブクエリの原子性は、より正確な文書検索と応答生成を保証し、複雑なクエリに対処するRAGシステムの能力を大幅に改善する。
論文 参考訳(メタデータ) (2025-05-17T09:36:03Z) - DocCGen: Document-based Controlled Code Generation [33.19206322891497]
DocCGenは、構造化コード言語のためのNL-to-Code生成タスクを2段階のプロセスに分解することで、豊富な知識を活用できるフレームワークである。
実験の結果,DocCGenは6つの評価指標すべてで,言語モデルのサイズを常に改善していることがわかった。
論文 参考訳(メタデータ) (2024-06-17T08:34:57Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Neural Transition-based Parsing of Library Deprecations [3.6382354548339295]
本稿では,オープンソースライブラリの非推奨API使用量を修正するためのコード更新の自動化に,そのリリースノートを分析して取り組む。
まず、WebクローラサービスがWebから非推奨のドキュメントを検索し、その後、特別に構築されたテキストがそれらのドキュメントを木構造表現に処理します。
提案手法の有効性を確認するため,7つの有名なPythonデータサイエンスライブラリから426のAPI非推奨を収集,ラベル付けし,そのアプローチが非自明なニューラルネットワーク翻訳ベースラインを決定的に上回ることを示した。
論文 参考訳(メタデータ) (2022-12-23T20:48:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。