論文の概要: CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models
- arxiv url: http://arxiv.org/abs/2503.23231v1
- Date: Sat, 29 Mar 2025 21:31:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:39:32.677522
- Title: CCCI: Code Completion with Contextual Information for Complex Data Transfer Tasks Using Large Language Models
- Title(参考訳): CCCI:大規模言語モデルを用いた複雑なデータ転送タスクのための文脈情報付きコード補完
- Authors: Hangzhan Jin, Mohammad Hamdaqa,
- Abstract要約: 本研究では,文脈認識型コード補完法であるCCCIを紹介する。
データベーステーブル関係のようなコンテキスト情報を統合することで、CCCIはコード補完の精度を向上させる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Unlike code generation, which involves creating code from scratch, code completion focuses on integrating new lines or blocks of code into an existing codebase. This process requires a deep understanding of the surrounding context, such as variable scope, object models, API calls, and database relations, to produce accurate results. These complex contextual dependencies make code completion a particularly challenging problem. Current models and approaches often fail to effectively incorporate such context, leading to inaccurate completions with low acceptance rates (around 30\%). For tasks like data transfer, which rely heavily on specific relationships and data structures, acceptance rates drop even further. This study introduces CCCI, a novel method for generating context-aware code completions specifically designed to address data transfer tasks. By integrating contextual information, such as database table relationships, object models, and library details into Large Language Models (LLMs), CCCI improves the accuracy of code completions. We evaluate CCCI using 289 Java snippets, extracted from over 819 operational scripts in an industrial setting. The results demonstrate that CCCI achieved a 49.1\% Build Pass rate and a 41.0\% CodeBLEU score, comparable to state-of-the-art methods that often struggle with complex task completion.
- Abstract(参考訳): スクラッチからコードを生成するコード生成とは異なり、コード補完は、新しい行やコードのブロックを既存のコードベースに統合することに焦点を当てている。
このプロセスは、正確な結果を得るために、変数スコープ、オブジェクトモデル、API呼び出し、データベース関係などの周囲のコンテキストを深く理解する必要があります。
このような複雑なコンテキスト依存は、コード補完を特に困難な問題にします。
現在のモデルとアプローチは、多くの場合、そのようなコンテキストを効果的に組み込むことができず、受け入れ率の低い不正確な完了(約30 %)につながる。
特定の関係やデータ構造に大きく依存するデータ転送のようなタスクの場合、受け入れ率はさらに低下します。
本研究では,データ転送タスクに特化して設計された文脈対応コード補完法であるCCCIを紹介する。
データベーステーブルの関係、オブジェクトモデル、ライブラリの詳細などのコンテキスト情報をLLM(Large Language Models)に統合することにより、CCCIはコード補完の精度を向上させる。
産業環境で819以上の運用スクリプトから抽出した289個のJavaスニペットを用いてCCCIを評価する。
その結果、CCCIは49.1\%のビルドパス率と41.0\%のCodeBLEUスコアを達成した。
関連論文リスト
- CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。
ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文 参考訳(メタデータ) (2025-02-12T21:42:56Z) - Deep Learning-based Code Completion: On the Impact on Performance of Contextual Information [14.79590382350231]
本稿では,DLベースのコード補完技術の性能が,状況によってどう影響するかを実証研究する。
追加のコンテキスト情報は、DLベースのコード補完のパフォーマンス向上に役立つ。
論文 参考訳(メタデータ) (2025-01-09T08:34:34Z) - ContextModule: Improving Code Completion via Repository-level Contextual Information [11.459065573651348]
ContextModuleは生成されたコードの関連性と精度を改善する。
我々は,実世界のコーディング環境における遅延制約を満たすために,インデックスキャッシングなどの性能最適化を実装した。
論文 参考訳(メタデータ) (2024-12-11T03:15:49Z) - Contextualized Data-Wrangling Code Generation in Computational Notebooks [131.26365849822932]
我々は、マルチモーダルなコンテキスト依存を明確にしたデータラングリングコード生成例をマイニングするために、CoCoMineという自動アプローチを提案する。
コンテクスト化されたデータラングリングコード生成のための58,221のサンプルを含むデータセットであるCoCoNoteをNotebooksで構築する。
実験結果は、データラングリングコード生成にデータコンテキストを組み込むことの重要性を示す。
論文 参考訳(メタデータ) (2024-09-20T14:49:51Z) - Dataflow-Guided Retrieval Augmentation for Repository-Level Code Completion [17.4397495929138]
本稿では,リポジトリレベルのコード補完のためのデータフロー誘導型検索拡張手法DraCoを提案する。
実験では、DraCoの精度と適用効率が向上し、コード精度が3.43%向上し、識別子F1スコアが平均3.27%向上した。
論文 参考訳(メタデータ) (2024-05-30T07:48:00Z) - CrossCodeEval: A Diverse and Multilingual Benchmark for Cross-File Code
Completion [86.01508183157613]
CrossCodeEvalは4つの人気のあるプログラミング言語の様々な現実世界、オープンソース、パーミッシブライセンスのリポジトリ上に構築されている。
関連するクロスファイルコンテキストが欠如している場合、CrossCodeEvalは極めて困難であることを示す。
また、コードレトリバーの能力を測定するためにCrossCodeEvalが使えることも示しています。
論文 参考訳(メタデータ) (2023-10-17T13:18:01Z) - CoCoMIC: Code Completion By Jointly Modeling In-file and Cross-file
Context [82.88371379927112]
予め訓練されたコード LM 上で,ファイル内コンテキストとファイル内コンテキストを協調的に学習するための,クロスファイルコンテキストを組み込んだフレームワークを提案する。
CoCoMICは既存のコードLMを33.94%の精度で改善し、クロスファイルコンテキストが提供されるとコード補完のための識別子マッチングが28.69%増加した。
論文 参考訳(メタデータ) (2022-12-20T05:48:09Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - CoSQA: 20,000+ Web Queries for Code Search and Question Answering [63.92224685262063]
CoSQAデータセットには、自然言語クエリとコードのペア用の20,604ラベルが含まれている。
本稿では,クエリコードマッチングを強化するために,CoCLRと呼ばれる対照的な学習手法を提案する。
我々は,CodeXGLUEを同じCodeBERTモデルで評価し,CoSQAのトレーニングにより,コード質問応答の精度が5.1%向上したことを示す。
論文 参考訳(メタデータ) (2021-05-27T15:37:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。