論文の概要: Relative Positioning Based Code Chunking Method For Rich Context Retrieval In Repository Level Code Completion Task With Code Language Model
- arxiv url: http://arxiv.org/abs/2510.08610v1
- Date: Tue, 07 Oct 2025 14:44:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.188877
- Title: Relative Positioning Based Code Chunking Method For Rich Context Retrieval In Repository Level Code Completion Task With Code Language Model
- Title(参考訳): コード言語モデルを用いたリポジトリレベルのコード補完タスクにおけるリッチコンテキスト検索のための相対的位置付けに基づくコードチャンキング手法
- Authors: Imranur Rahman, Md Rayhanur Rahman,
- Abstract要約: 本稿では,大規模言語モデル(LLM)によるコード補完作業の効率化を支援する効果的なコンテキスト収集戦略について述べる。
最終的なコンテキストにおけるコードのチャンキングと相対的な位置決めによって、コード補完タスクのパフォーマンスが向上することが分かりました。
- 参考スコア(独自算出の注目度): 0.25066242154596113
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Code completion can help developers improve efficiency and ease the development lifecycle. Although code completion is available in modern integrated development environments (IDEs), research lacks in determining what makes a good context for code completion based on the information available to the IDEs for the large language models (LLMs) to perform better. In this paper, we describe an effective context collection strategy to assist the LLMs in performing better at code completion tasks. The key idea of our strategy is to preprocess the repository into smaller code chunks and later use syntactic and semantic similarity-based code chunk retrieval with relative positioning. We found that code chunking and relative positioning of the chunks in the final context improve the performance of code completion tasks.
- Abstract(参考訳): コード補完は、開発者が効率を改善し、開発ライフサイクルを楽にするのに役立つ。
コード補完は、近代的な統合開発環境(IDE)で利用できるが、大規模な言語モデル(LLM)のIDEで利用できる情報に基づいて、コード補完がどのような状況で良いかを決定する研究は不十分である。
本稿では,LLMにおけるコード補完作業の効率化を支援する効果的なコンテキスト収集戦略について述べる。
私たちの戦略の鍵となる考え方は、リポジトリを小さなコードチャンクにプリプロセスし、その後、相対的な位置付けを伴う構文的および意味的類似性に基づくコードチャンク検索を使用することです。
最終的なコンテキストにおけるコードのチャンキングと相対的な位置決めによって、コード補完タスクのパフォーマンスが向上することが分かりました。
関連論文リスト
- ContextModule: Improving Code Completion via Repository-level Contextual Information [11.459065573651348]
ContextModuleは生成されたコードの関連性と精度を改善する。
我々は,実世界のコーディング環境における遅延制約を満たすために,インデックスキャッシングなどの性能最適化を実装した。
論文 参考訳(メタデータ) (2024-12-11T03:15:49Z) - Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文 参考訳(メタデータ) (2024-10-02T09:11:10Z) - On the Impacts of Contexts on Repository-Level Code Generation [5.641402231731082]
本稿ではレポジトリレベルのコード生成を評価するために設計された新しいベンチマークであるRepoExecを紹介する。
実行可能性、包括的なテストケース生成による機能的正当性、ファイル間のコンテキストの正確な利用という3つの重要な側面に注目します。
論文 参考訳(メタデータ) (2024-06-17T10:45:22Z) - GraphCoder: Enhancing Repository-Level Code Completion via Code Context Graph-based Retrieval and Language Model [30.625128161499195]
GraphCoderは検索拡張コード補完フレームワークである。
一般的なコード知識と、グラフベースの検索生成プロセスを通じてリポジトリ固有の知識を使用する。
コードマッチでは+6.06、識別子マッチでは+6.23となり、時間と空間は少ない。
論文 参考訳(メタデータ) (2024-06-11T06:55:32Z) - On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文 参考訳(メタデータ) (2024-06-06T19:44:17Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。