論文の概要: Context-as-AI-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation
- arxiv url: http://arxiv.org/abs/2606.04397v2
- Date: Thu, 04 Jun 2026 04:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:33.29706
- Title: Context-as-AI-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation
- Title(参考訳): Context-as-AI-Service: LLM生成開発者ドキュメンテーションのためのクロスファイル依存性チェーン
- Authors: Ameya Gawde, Vyzantinos Repantis, Harshvardhan Singh, Lucy Moys,
- Abstract要約: 我々は、LCMエージェントがドキュメントのレビューや生成時に証拠を見つけるためにクエリする検索層であるContext-as-AI-Service(CAIS)を提示する。
CAISはソースコード、API参照、アップストリームドキュメンテーションをインデックスし、エージェントはキーワードとセマンティック検索を組み合わせたツールコールを通じてインデックスをクエリできる。
CAISは2つのタスクで壁時計時間を22%減らして34%減らし、入力トーケンの使用を減らした。
- 参考スコア(独自算出の注目度): 1.5749416770494706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents increasingly write and maintain developer documentation, but usefulness and accuracy often rely on dependency chains that are not obvious to follow. Even with more files in context, the agent must still decide which cross-file dependencies to trace. We present Context-as-AI-Service (CAIS), a retrieval layer that LLM agents query to find evidence across the codebase as they review or generate documentation. CAIS indexes source code, API references, and upstream documentation, then enables agents to query the index through tool calls that combine keyword and semantic search. We evaluate CAIS in two case studies using Claude Sonnet 4.6 on a production SDK: improving API reference comments in a core source file and validating an LLM-generated tutorial. In both studies, the baseline already had ordinary repository tools such as file reads, keyword search, and symbol navigation. CAIS adds a retrieval layer on top, so the comparison isolates added retrieval rather than basic repository access. In the API-reference review, the CAIS-augmented agent produced the same 5 missing-documentation fixes as the baseline and surfaced 4 findings the baseline missed: 2 cross-file factual errors and 2 underspecified API comments. In the tutorial validation, it surfaced 1 executable bug, 1 API-usage improvement, and 2 missing prerequisites that the baseline pipeline did not catch. These findings required tracing non-obvious dependency chains across utility files, framework internals, usage examples, tests, and component-creation logic. Over five runs per condition, adding CAIS reduced wall-clock time by 22% to 34% across the two tasks and lowered input-token usage.
- Abstract(参考訳): LLMエージェントは、ますます開発者のドキュメントを書いて保守するようになっているが、有用性や正確性は、従うべきでない依存関係チェーンに依存していることが多い。
コンテキストにより多くのファイルがある場合でも、エージェントはトレースするクロスファイル依存関係を決定する必要がある。
LLMエージェントがレビューやドキュメントの生成時にコードベース全体にわたってエビデンスを見つけるためにクエリする検索層であるContext-as-AI-Service(CAIS)を提示する。
CAISはソースコード、API参照、アップストリームドキュメンテーションをインデックスし、エージェントはキーワードとセマンティック検索を組み合わせたツールコールを通じてインデックスをクエリできる。
プロダクションSDK上でClaude Sonnet 4.6を使用してCAISを評価する2つのケーススタディとして、コアソースファイルにおけるAPI参照コメントの改善とLLM生成チュートリアルの検証を行った。
どちらの研究でも、ベースラインにはファイル読み込み、キーワード検索、シンボルナビゲーションといった一般的なリポジトリツールがすでにある。
CAISは検索層を上部に追加するので、比較は基本的なリポジトリアクセスではなく、追加の検索を分離する。
API参照レビューでは、CAIS拡張されたエージェントが、ベースラインと同じ5つの欠落文書修正を作成した。
チュートリアルのバリデーションでは、1つの実行可能なバグ、1つのAPI使用率の改善、2つの欠落した前提条件がベースラインパイプラインがキャッチしなかった。
これらの発見には、ユーティリティファイル、フレームワーク内部、使用例、テスト、コンポーネント生成ロジックにまたがる、不要な依存関係チェーンのトレースが必要だった。
CAISは2つのタスクで壁時計時間を22%減らして34%減らし、入力トーケンの使用を減らした。
関連論文リスト
- Diagnosing Knowledge Gaps in LLM Tool Use: An Agentic Benchmark for Novel API Acquisition [2.392878902712915]
NovelAPIBenchは、任意のベースモデルとターゲットライブラリの動的ベンチマークである。
探索によって注入された知識とパラメトリック適応によって内部化された知識を比較した。
Retrievalは揮発性のAPIコンテンツを提供し、チューニングは手続き統合を改善する。
論文 参考訳(メタデータ) (2026-06-02T13:46:04Z) - Remember Your Trace: Memory-Guided Long-Horizon Agentic Framework for Consistent and Hierarchical Repository-Level Code Documentation [27.40384564559557]
我々は、リポジトリ全体にまたがる単一の統合コンテキスト内でドキュメントを生成するフレームワークであるMemDocAgentを提案する。
MemDocAgentは、オープンソースベースラインとクローズドソースベースラインの両方で最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-05-14T08:35:20Z) - LARGER: Lexically Anchored Repository Graph Exploration and Retrieval [9.90137784523552]
リポジトリレベルのコーディングエージェントは、まずタスクに関連するファイルとシンボルをローカライズする必要がある。
既存のアプローチでは、エージェントのインタラクションループを断片化する別々のグラフツールやステージが必要になることが多い。
LARGER(Lexically anchored active-set search framework)は、語彙マッチングから始まり、それらをグラフアンカーにアライメントし、エージェントの既存のサーチループ内で信頼フィルタリングされた局所展開を実行する。
論文 参考訳(メタデータ) (2026-05-08T05:03:46Z) - Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? [3.2610504259514754]
実世界のタスクにコンテキストファイルが有効かどうかを検討する。
コンテクストファイルはリポジトリのコンテキストを提供しないのに比べてタスクの成功率を低下させる傾向がある。
我々は、コンテキストファイルからの不要な要求はタスクを難しくし、人間によるコンテキストファイルは最小限の要求だけを記述するべきであると結論付けている。
論文 参考訳(メタデータ) (2026-02-12T14:15:22Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z) - AlignCoder: Aligning Retrieval with Target Intent for Repository-Level Code Completion [55.21541958868449]
リポジトリレベルのコード補完フレームワークであるAlignCoderを提案する。
我々のフレームワークは、初期クエリとターゲットコードのセマンティックギャップを橋渡しする拡張クエリを生成する。
我々は、拡張クエリにおける推論情報を活用してより正確な検索を行うAlignRetrieverのトレーニングに強化学習を採用する。
論文 参考訳(メタデータ) (2026-01-27T15:23:14Z) - RANGER -- Repository-Level Agent for Graph-Enhanced Retrieval [0.38298911754746934]
汎用自動化ソフトウェアエンジニアリング(ASE)には、コード補完、検索、修復、QA、要約といったタスクが含まれる。
これらのタスクは、コードエンティティやコードエンティティクエリに関する特定のクエリを処理できるコード検索システムを必要とする。
本稿では、両方のクエリタイプに対応するように設計されたリポジトリレベルのコード検索エージェントであるRANGERを紹介する。
論文 参考訳(メタデータ) (2025-09-27T18:57:02Z) - Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models [44.31597857713689]
最初の段階でActive Indexingを導入し、一般化可能なソースアンコールバインディングを作成します。
Qwen-2.5-7B&3Bの実験は、アクティブインデックスがパッシブインデックスのベースラインを一貫して上回っていることを示している。
内部の引用は、モデルを検索ノイズに対してより堅牢にすることで、外部の引用を補完する。
論文 参考訳(メタデータ) (2025-06-21T04:48:05Z) - Document Attribution: Examining Citation Relationships using Large Language Models [62.46146670035751]
そこで本研究では,帰属を簡単なテキスト・エンタテインメント・タスクとみなすゼロショット・アプローチを提案する。
また,アトリビューションプロセスの強化におけるアテンションメカニズムの役割についても検討する。
論文 参考訳(メタデータ) (2025-05-09T04:40:11Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。