論文の概要: Enhancing Project-Specific Code Completion by Inferring Internal API Information
- arxiv url: http://arxiv.org/abs/2507.20888v1
- Date: Mon, 28 Jul 2025 14:39:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.164645
- Title: Enhancing Project-Specific Code Completion by Inferring Internal API Information
- Title(参考訳): 内部API情報の推測によるプロジェクト特化コード補完の強化
- Authors: Le Deng, Xiaoxue Ren, Chao Ni, Ming Liang, David Lo, Zhongxin Liu,
- Abstract要約: 本稿では,インポートに頼ることなく内部API情報を推測する手法を提案する。
本手法は,APIの使用例と意味記述を構築することによって,APIの表現を拡張する。
提案手法は既存の手法を著しく上回り,コード精度が22.72%向上し,識別子精度が18.31%向上した。
- 参考スコア(独自算出の注目度): 12.15470510295993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Project-specific code completion is a critical task that leverages context from a project to generate accurate code. State-of-the-art methods use retrieval-augmented generation (RAG) with large language models (LLMs) and project information for code completion. However, they often struggle to incorporate internal API information, which is crucial for accuracy, especially when APIs are not explicitly imported in the file. To address this, we propose a method to infer internal API information without relying on imports. Our method extends the representation of APIs by constructing usage examples and semantic descriptions, building a knowledge base for LLMs to generate relevant completions. We also introduce ProjBench, a benchmark that avoids leaked imports and consists of large-scale real-world projects. Experiments on ProjBench and CrossCodeEval show that our approach significantly outperforms existing methods, improving code exact match by 22.72% and identifier exact match by 18.31%. Additionally, integrating our method with existing baselines boosts code match by 47.80% and identifier match by 35.55%.
- Abstract(参考訳): プロジェクト固有のコード補完は、プロジェクトからコンテキストを利用して正確なコードを生成する重要なタスクである。
State-of-the-artメソッドは、大規模な言語モデル(LLM)とコード補完のためのプロジェクト情報を備えた検索拡張生成(RAG)を使用する。
しかし、特にファイルに明示的にインポートされていないAPIでは、正確性に不可欠な内部API情報を組み込むのに苦労することが多い。
そこで本研究では,インポートに頼ることなく内部API情報を推論する手法を提案する。
提案手法は,使用例と意味記述を構築してAPI表現を拡張し,LLMの知識ベースを構築し,関連する補完を生成する。
また、漏洩したインポートを避け、大規模な実世界のプロジェクトで構成されるベンチマークであるProjBenchを紹介します。
ProjBenchとCrossCodeEvalの実験は、我々のアプローチが既存のメソッドよりも大幅に優れており、コードの正確なマッチが22.72%、識別子の正確なマッチが18.31%向上していることを示している。
さらに、既存のベースラインとメソッドを統合することで、コードマッチングが47.80%、識別子マッチングが35.55%向上する。
関連論文リスト
- ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.26807758443675]
ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-12-06T19:00:15Z) - A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.665460257371164]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文 参考訳(メタデータ) (2024-09-23T17:22:09Z) - Contextual API Completion for Unseen Repositories Using LLMs [6.518508607788089]
本稿では,API補完タスクのためのコードリポジトリ内で,グローバルおよびローカルなコンテキスト情報を活用することで幻覚を緩和する新しい手法を提案する。
当社のアプローチは、ローカルAPI補完の最適化に重点を置いて、コード補完タスクの洗練に適合しています。
私たちのツールであるLANCEは、APIトークンの補完と会話APIの補完で、Copilotを143%、Copilotを142%上回っています。
論文 参考訳(メタデータ) (2024-05-07T18:22:28Z) - Are Human Rules Necessary? Generating Reusable APIs with CoT Reasoning and In-Context Learning [14.351476383642016]
そこで我々は,Stack OverflowコードスニペットのAPIzationを自動的に実行する,Code2APIという新しいアプローチを提案する。
Code2APIは、追加のモデルトレーニングや手作業のルールを必要としない。
他の外部ツールに頼ることなく、パーソナルコンピュータに簡単にデプロイできる。
論文 参考訳(メタデータ) (2024-05-06T14:22:17Z) - Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。
プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。
TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-07-28T07:43:13Z) - Evaluating Embedding APIs for Information Retrieval [51.24236853841468]
ドメインの一般化と多言語検索における既存のセマンティック埋め込みAPIの機能を評価する。
BM25の結果をAPIを使って再ランク付けすることは、予算に優しいアプローチであり、英語でもっとも効果的である。
非英語検索では、再ランク付けは結果を改善するが、BM25のハイブリッドモデルは高いコストで機能する。
論文 参考訳(メタデータ) (2023-05-10T16:40:52Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。