論文の概要: Impact-driven Context Filtering For Cross-file Code Completion
- arxiv url: http://arxiv.org/abs/2508.05970v1
- Date: Fri, 08 Aug 2025 03:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 20:39:06.056477
- Title: Impact-driven Context Filtering For Cross-file Code Completion
- Title(参考訳): クロスファイルコード補完のためのインパクト駆動型コンテキストフィルタリング
- Authors: Yanzhou Li, Shangqing Liu, Kangjie Chen, Tianwei Zhang, Yang Liu,
- Abstract要約: Retrieval-augmented Generation (RAG)は、最近リポジトリレベルのコード補完の可能性を示している。
検索したクロスファイルコンテキストのコントリビューションをよりよく理解するために,検索した各コードチャンクが完了に与える影響を評価する。
これらの結果は、リポジトリレベルのコード補完の正確性、効率、および属性性を高めるためのCODEの可能性を強調します。
- 参考スコア(独自算出の注目度): 19.717276276962483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented generation (RAG) has recently demonstrated considerable potential for repository-level code completion, as it integrates cross-file knowledge with in-file preceding code to provide comprehensive contexts for generation. To better understand the contribution of the retrieved cross-file contexts, we introduce a likelihood-based metric to evaluate the impact of each retrieved code chunk on the completion. Our analysis reveals that, despite retrieving numerous chunks, only a small subset positively contributes to the completion, while some chunks even degrade performance. To address this issue, we leverage this metric to construct a repository-level dataset where each retrieved chunk is labeled as positive, neutral, or negative based on its relevance to the target completion. We then propose an adaptive retrieval context filtering framework, CODEFILTER, trained on this dataset to mitigate the harmful effects of negative retrieved contexts in code completion. Extensive evaluation on the RepoEval and CrossCodeLongEval benchmarks demonstrates that CODEFILTER consistently improves completion accuracy compared to approaches without filtering operations across various tasks. Additionally, CODEFILTER significantly reduces the length of the input prompt, enhancing computational efficiency while exhibiting strong generalizability across different models. These results underscore the potential of CODEFILTER to enhance the accuracy, efficiency, and attributability of repository-level code completion.
- Abstract(参考訳): Retrieval-augmented Generation (RAG)は、最近リポジトリレベルのコード補完の可能性を示した。
検索したクロスファイルコンテキストのコントリビューションをよりよく理解するために,検索した各コードチャンクが完了に与える影響を評価するための可能性ベースのメトリクスを導入する。
分析の結果,多数のチャンクを回収したにもかかわらず,少数のサブセットだけが完了に肯定的な貢献をする一方で,一部のチャンクは性能を低下させることがわかった。
この問題に対処するため、我々はこの指標を利用して、検索したチャンクを対象の完了との関係に基づいて、正、中、負のラベルでラベル付けしたリポジトリレベルのデータセットを構築する。
次に、このデータセットに基づいて訓練された適応型検索コンテキストフィルタリングフレームワークCODEFILTERを提案し、コード補完における負の検索コンテキストの有害な影響を軽減する。
RepoEvalとCrossCodeLongEvalベンチマークの大規模な評価は、CODEFILTERが様々なタスクにまたがる操作をフィルタリングしないアプローチと比較して、コンプリート精度を一貫して改善していることを示している。
さらに、CODEFILTERは入力プロンプトの長さを大幅に削減し、異なるモデル間で強い一般化性を示しながら計算効率を向上する。
これらの結果は、リポジトリレベルのコード補完の正確性、効率、属性性を向上するCODEFILTERの可能性を強調している。
関連論文リスト
- Hierarchical Context Pruning: Optimizing Real-World Code Completion with Repository-Level Pretrained Code LLMs [24.00351065427465]
本稿では,階層型コンテキストプルーニング(HCP)という戦略を提案し,高い情報量を持つコンプリートプロンプトを構築する。
HCPは関数レベルでコードリポジトリをモデル化し、コードファイル間のトポロジ的な依存関係を維持しながら、大量の無関係なコードコンテンツを削除する。
論文 参考訳(メタデータ) (2024-06-26T12:26:16Z) - Dataflow-Guided Retrieval Augmentation for Repository-Level Code Completion [17.4397495929138]
本稿では,リポジトリレベルのコード補完のためのデータフロー誘導型検索拡張手法DraCoを提案する。
実験では、DraCoの精度と適用効率が向上し、コード精度が3.43%向上し、識別子F1スコアが平均3.27%向上した。
論文 参考訳(メタデータ) (2024-05-30T07:48:00Z) - Repoformer: Selective Retrieval for Repository-Level Code Completion [30.706277772743615]
検索強化生成(RAG)の最近の進歩は、リポジトリレベルのコード補完の新たな時代が始まった。
本稿では,不要な場合の検索を回避するため,選択的なRAGフレームワークを提案する。
我々のフレームワークは、異なる世代モデル、レトリバー、プログラミング言語に対応できることを示します。
論文 参考訳(メタデータ) (2024-03-15T06:59:43Z) - RecDCL: Dual Contrastive Learning for Recommendation [65.6236784430981]
本稿では、RecDCLという2つのコントラスト学習推薦フレームワークを提案する。
RecDCLでは、FCLの目的は、ユーザとイテムの正のペアに対する冗長なソリューションを排除することである。
BCLの目的は、表現の堅牢性を高めるために出力ベクトルにコントラスト埋め込みを生成するために利用される。
論文 参考訳(メタデータ) (2024-01-28T11:51:09Z) - CrossCodeEval: A Diverse and Multilingual Benchmark for Cross-File Code
Completion [86.01508183157613]
CrossCodeEvalは4つの人気のあるプログラミング言語の様々な現実世界、オープンソース、パーミッシブライセンスのリポジトリ上に構築されている。
関連するクロスファイルコンテキストが欠如している場合、CrossCodeEvalは極めて困難であることを示す。
また、コードレトリバーの能力を測定するためにCrossCodeEvalが使えることも示しています。
論文 参考訳(メタデータ) (2023-10-17T13:18:01Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。