Fugu-MT 論文翻訳(概要): Enhancing Project-Specific Code Completion by Inferring Internal API Information

論文の概要: Enhancing Project-Specific Code Completion by Inferring Internal API Information

arxiv url: http://arxiv.org/abs/2507.20888v1
Date: Mon, 28 Jul 2025 14:39:46 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-29 16:23:58.164645
Title: Enhancing Project-Specific Code Completion by Inferring Internal API Information
Title（参考訳）: 内部API情報の推測によるプロジェクト特化コード補完の強化
Authors: Le Deng, Xiaoxue Ren, Chao Ni, Ming Liang, David Lo, Zhongxin Liu,
Abstract要約: 本稿では,インポートに頼ることなく内部API情報を推測する手法を提案する。本手法は,APIの使用例と意味記述を構築することによって,APIの表現を拡張する。提案手法は既存の手法を著しく上回り,コード精度が22.72%向上し,識別子精度が18.31%向上した。
参考スコア（独自算出の注目度）: 12.15470510295993
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Project-specific code completion is a critical task that leverages context from a project to generate accurate code. State-of-the-art methods use retrieval-augmented generation (RAG) with large language models (LLMs) and project information for code completion. However, they often struggle to incorporate internal API information, which is crucial for accuracy, especially when APIs are not explicitly imported in the file. To address this, we propose a method to infer internal API information without relying on imports. Our method extends the representation of APIs by constructing usage examples and semantic descriptions, building a knowledge base for LLMs to generate relevant completions. We also introduce ProjBench, a benchmark that avoids leaked imports and consists of large-scale real-world projects. Experiments on ProjBench and CrossCodeEval show that our approach significantly outperforms existing methods, improving code exact match by 22.72% and identifier exact match by 18.31%. Additionally, integrating our method with existing baselines boosts code match by 47.80% and identifier match by 35.55%.
Abstract（参考訳）: プロジェクト固有のコード補完は、プロジェクトからコンテキストを利用して正確なコードを生成する重要なタスクである。 State-of-the-artメソッドは、大規模な言語モデル(LLM)とコード補完のためのプロジェクト情報を備えた検索拡張生成(RAG)を使用する。しかし、特にファイルに明示的にインポートされていないAPIでは、正確性に不可欠な内部API情報を組み込むのに苦労することが多い。そこで本研究では,インポートに頼ることなく内部API情報を推論する手法を提案する。提案手法は,使用例と意味記述を構築してAPI表現を拡張し,LLMの知識ベースを構築し,関連する補完を生成する。また、漏洩したインポートを避け、大規模な実世界のプロジェクトで構成されるベンチマークであるProjBenchを紹介します。 ProjBenchとCrossCodeEvalの実験は、我々のアプローチが既存のメソッドよりも大幅に優れており、コードの正確なマッチが22.72%、識別子の正確なマッチが18.31%向上していることを示している。さらに、既存のベースラインとメソッドを統合することで、コードマッチングが47.80%、識別子マッチングが35.55%向上する。

関連論文リスト

AlignCoder: Aligning Retrieval with Target Intent for Repository-Level Code Completion [55.21541958868449]
リポジトリレベルのコード補完フレームワークであるAlignCoderを提案する。我々のフレームワークは、初期クエリとターゲットコードのセマンティックギャップを橋渡しする拡張クエリを生成する。我々は、拡張クエリにおける推論情報を活用してより正確な検索を行うAlignRetrieverのトレーニングに強化学習を採用する。
論文参考訳（メタデータ） (2026-01-27T15:23:14Z)
CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models [0.0]
本研究では,文脈認識型コード補完法であるCCCIを紹介する。データベーステーブル関係のようなコンテキスト情報を統合することで、CCCIはコード補完の精度を向上させる。
論文参考訳（メタデータ） (2025-03-29T21:31:19Z)
ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.26807758443675]
ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文参考訳（メタデータ） (2024-12-06T19:00:15Z)
A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.665460257371164]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。 API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳（メタデータ） (2024-09-23T17:22:09Z)
A Systematic Evaluation of Large Code Models in API Suggestion: When, Which, and How [53.65636914757381]
API提案は、現代のソフトウェア開発において重要なタスクである。大規模コードモデル(LCM)の最近の進歩は、API提案タスクにおいて有望であることを示している。
論文参考訳（メタデータ） (2024-09-20T03:12:35Z)
Long Code Arena: a Set of Benchmarks for Long-Context Code Models [75.70507534322336]
Long Code Arenaは、プロジェクト全体のコンテキストを必要とするコード処理タスクのための6つのベンチマークスイートである。これらのタスクは、ライブラリベースのコード生成、CIビルドの修復、プロジェクトレベルのコード補完、コミットメッセージ生成、バグローカライゼーション、モジュールの要約といった、コード処理のさまざまな側面をカバーする。各タスクに対して、テスト用の手作業によるデータセット、評価スイート、オープンソースのベースラインソリューションを提供しています。
論文参考訳（メタデータ） (2024-06-17T14:58:29Z)
Contextual API Completion for Unseen Repositories Using LLMs [6.518508607788089]
本稿では,API補完タスクのためのコードリポジトリ内で,グローバルおよびローカルなコンテキスト情報を活用することで幻覚を緩和する新しい手法を提案する。当社のアプローチは、ローカルAPI補完の最適化に重点を置いて、コード補完タスクの洗練に適合しています。私たちのツールであるLANCEは、APIトークンの補完と会話APIの補完で、Copilotを143%、Copilotを142%上回っています。
論文参考訳（メタデータ） (2024-05-07T18:22:28Z)
Are Human Rules Necessary? Generating Reusable APIs with CoT Reasoning and In-Context Learning [14.351476383642016]
そこで我々は,Stack OverflowコードスニペットのAPIzationを自動的に実行する,Code2APIという新しいアプローチを提案する。 Code2APIは、追加のモデルトレーニングや手作業のルールを必要としない。他の外部ツールに頼ることなく、パーソナルコンピュータに簡単にデプロイできる。
論文参考訳（メタデータ） (2024-05-06T14:22:17Z)
APIGen: Generative API Method Recommendation [16.541442856821]
APIGenは、拡張インコンテキスト学習(ICL)によるジェネレーティブAPIレコメンデーションアプローチである APIGenは、語彙、構文、意味の観点から、プログラミングクエリに類似したポストを検索する。推論プロセスにより、APIGenはクエリのプログラミング要件を満たすための推奨APIを提供する。
論文参考訳（メタデータ） (2024-01-29T02:35:42Z)
Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。 TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文参考訳（メタデータ） (2023-07-28T07:43:13Z)
Evaluating Embedding APIs for Information Retrieval [51.24236853841468]
ドメインの一般化と多言語検索における既存のセマンティック埋め込みAPIの機能を評価する。 BM25の結果をAPIを使って再ランク付けすることは、予算に優しいアプローチであり、英語でもっとも効果的である。非英語検索では、再ランク付けは結果を改善するが、BM25のハイブリッドモデルは高いコストで機能する。
論文参考訳（メタデータ） (2023-05-10T16:40:52Z)
RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2023-03-22T13:54:46Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。